內地初創公司DeepSeek早前推出的人工智能(AI)推理模型DeepSeek,備受全球關注。由於訓練成本遠低於同類產品,但性能可與美國AI龍頭OpenAI最新模型媲美,挑戰美國在AI領域的主導地位。DeepSeek的應用程式也在蘋果美國和中國區的App Store短時間登上第一。
由於DeepSeek有可能顛覆科技界,美股納指期貨在周一(27日)亞洲交易時段下跌近400點。輝達(Nvidia)的主要供應商,東京上市的Advantest Corporation股價也下跌了8.2%。相反,本港的AI概念股表現良好,百度(09888)、阿里巴巴(09988)、商湯(00020)、第四範式(06682)全線向上升。
【新聞有價 記者有格 立即訂閱:http://bit.ly/3wGQh7c】
DeepSeek於1月20日公布了新一代開源大模型DeepSeek-R1。這款模型聲稱在數學、代碼和自然語言推理等任務上的表現可與OpenAI最新的o1大模型正式版媲美。在大模型排名榜Arena上,該模型的基準測試排名目前已上升至全類別大模型的第三名,與OpenAI的ChatGPT-4o最新版並列。目前,DeepSeek在美區下載的免費排行榜中位居第一。
DeepSeek-R1在開源程度上遠超競爭對手。它不僅開放代碼,允許任何人免費使用、修改和商業化,還允許使用者利用它來訓練自己的模型,完全打破以往大型語言模型被少數公司壟斷的局面。
由於訓練成本極其低廉,該模型也被行內人戲稱為「AI界的拼多多」。行業網站ChinaZ.com披露,DeepSeek-R1研發成本為600萬美元,只是使用約2,000片Nvidia的晶片,美國大公司的AI系統需使用多達1.6萬塊晶片。
Aletheia Capital指,如果DeepSeek真的能以微薄預算構建大型語言模型,可能會使投資者重新考慮美國公司的估值。瑞聯銀行董事總經理Vey-Sern Ling表示,DeepSeek顯示出開發強大人工智能模型的可能性,而且成本更低,可能會擾亂整個原先主要依賴少數幾家超大規模企業的AI供應鏈的投資案例。
微軟CEO納德拉指出,DeepSeek的新模型推理計算效率極高,令人印象深刻,「我們應該非常嚴肅地看待中國AI的發展」。《紐約時報》亦撰文大讚,DeepSeek-R1以極低成本和少量晶片,實現與OpenAI等巨頭相媲美的性能,挑戰「唯有科技巨頭才能研發尖端AI」的行業共識。
內地傳媒報道,DeepSeek模型由杭州深度求索(DeepSeek)公司開發研究,DeepSeek-R1的性能比得上Chat-GPT-4o,投入研發費用558萬美元,訓練成本只是Chat-GPT的20分之1,而且只用了2048張H100的GPU集群,需時只有53天。 公司2023年7月成立,負創辦人之一的梁文鋒是金融圈成名已久的高手,他創立的幻方量化,為內地量化私募巨頭之一。
#DeepSeek #成本低性能高 #媲美OpenAI #只用2千片晶片 #衝擊AI巨企 #杭州深度求索 #創辦人 #金融圈高手
#DeepSeek #成本低性能高 #媲美OpenAI #只用2千片晶片 #衝擊AI巨企 #杭州深度求索 #創辦人 #金融圈高手