財經新聞

輝達助攻 鴻海研究院推首款繁體中文AI大語言模型 數學邏輯推理特強

出版: -
0
輝達助攻 鴻海研究院推首款繁體中文AI大語言模型 數學邏輯推理特強
有用過AIChat等解決疑難雜症的讀者,大都領教過不時出現簡體字的「創建」或「生成」。不過情況開始有變,事關台灣鴻海今天(10日)上午宣佈,其研究院推出了第1版具有推理能力的人工智能(AI)繁體中文大型語言模型。未來,鴻海將透過導入AI大型語言模型,提升智能製造、智能電動車及智慧城市等三大平台的數據分析效率。
在模型訓練過程中,鴻海指出,輝達提供了Taipei-1超級電腦及技術諮詢,協助鴻海研究院成功完成模型訓練,並使用輝達(NVIDIA)NeMo人工智慧模型服務。
【新聞有價 記者有格 立即訂閱:http://bit.ly/3wGQh7c】
該繁體中文大型語言模型,內部開發代碼為FoxBrain。FoxBrain模型最初是為內部應用而設計的,涵蓋數據分析、決策輔助、文書協作、數學、推理解題及代碼生成等功能,未來將對外開源分享。
「開源」(open sourced)意指支撐AI的運算代碼將公開給其他企業和研究人員,讓所有人都能使用這些技術來建構和推廣自己的產品。
鴻海指出,FoxBrain作為鴻海研究院AI推理LLM模型的訓練成果,展現了理解與推理能力。在數學及邏輯推理測試中表現出色,並且能增強台灣使用者的語言風格。
鴻海研究院解釋,人工智慧研究所在FoxBrain的訓練過程中,使用了120張輝達(NVIDIA)H100繪圖處理器(GPU),並透過NVIDIA Quantum-2 InfiniBand網路擴展,僅花費約4週時間完成,這種模型訓練方式具備低成本和高效率的特性。
在相關規格與訓練策略方面,鴻海研究院指出,FoxBrain透過自主技術建立了24類主題的資料增強方式與品質評估方法,生成了98B詞元(tokens)高品質中文預訓練資料,上下文處理的長度為128K token,總計算力花費為2688 GPU days,並採用了多節點平行訓練架構,以確保高效能與穩定性。
在測試結果上,鴻海研究院表示,FoxBrain在數學領域較基礎模型Meta Llama 3.1全面提升。相較於目前最好的繁體中文大模型Taiwan Llama,FoxBrain在數學測試中取得顯著進步,並在數學推理能力方面超越Meta目前已推出的同等級模型。雖然與DeepSeek蒸餾模型仍有些微差距,但其表現已相當接近世界領先水平。
鴻海指出,未來將透過導入AI大型語言模型,強化智能製造、智能電動車及智慧城市等三大平台的數據分析效率,使FoxBrain成為推動智慧應用升級的重要引擎,並計劃對外開源分享,以擴大模型的應用範圍,與技術夥伴共同推動AI在製造業、供應鏈管理及智慧決策領域的應用。
鴻海又指,FoxBrain的成果將於美國時間3月17日起舉行的輝達年度GTC大會專題演講中首次對外發表,主題為「From Open Source to Frontier AI: Build, Customize, and Extend Foundation Models」。
求真求知 報道實況 三年風雨 屹立不倒
如果唔想我哋消失😭
繼續全天候睇到最新+全面+真確報道
同消閒副刊、生活資訊、體育、娛樂等創新優質多元資訊
請即成為Channel C付費會員「自己友」 訂閱享專屬福利!
👉🏻https://bit.ly/3wK00JQ
下載埋Channel C App 瀏覽足本報道!
👉🏻https://channelchk.com/app
大大力召集更多廣告推廣/媒體合作 專業用心締造流量保證!
👉🏻[email protected]
感激讀者及客戶厚愛與扶持 支持我哋穩定營運長遠拓展
屬於Channel C一份子嘅每一個您 成就未來每個週年🫶🏻
【盡知天下事 唯有Channel C】

🔥「爆片爆相」返嚟喇!🔥 
一經獨家採用將會獲得由
齊柏林熱狗店送出$50禮券乙張! 
報料:https://wa.me/85264691456
爆片爆相