富士康開發出臺灣首個推理大模型 性能落后于DeepSeek
北京時間3月10日,據《華爾街日報》報道,富士康母公司鴻海已研發出中國臺灣地區首個具備先進推理能力的大模型,性能上落后于DeepSeek的部分大模型。
鴻海周一表示,已自主研發了具備推理能力的人工智能(AI)大語言模型FoxBrain,并在四周內完成訓練。FoxBrain最初為公司內部使用而設計,具備數據分析、數學運算、推理以及代碼生成的能力。
鴻海稱,英偉達通過其臺灣超級計算機和技術咨詢為鴻海提供了支持,使得大模型訓練得以成功完成。該公司表示,計劃將該模型開源,以便與行業合作伙伴開展合作,并希望FoxBrain推動制造和供應鏈管理方面的進步。
鴻海研究院AI研究所所長栗永徽表示,該模型在解決問題時“優先考慮優化訓練策略,而不是單純依賴算力”。鴻海表示,栗永徽的團隊使用了120個英偉達H100圖形處理單元(GPU),在大約四周時間內完成了FoxBrain的訓練。
鴻海已公布了FoxBrain的一些參數,表示它是基于Meta公開可用的大語言模型Llama 3.1的架構構建而成,是臺灣地區首個具備先進推理能力的大語言模型,專為臺灣地區使用的繁體中文而設計和優化。鴻海稱,FoxBrain的性能略遜于DeepSeek的部分模型,但已接近世界一流水平。該公司表示,更多相關信息將在今年3月中旬的英偉達年度技術大會上公布。
富士康是鴻海的產品代工子公司,因組裝 蘋果 公司的iPhone而被外界熟知。鴻海在核心電子制造業務方面正面臨產業轉型以及盈利能力下降所帶來的挑戰,已開始向AI、電動 汽車 等領域拓展業務。
【來源: 鳳凰網 科技 】