擰巴的扎克伯格
出品 | 虎嗅科技組
作者 | 房曉楠
編輯 | 苗正卿
頭圖 | 視覺中國
無疑,這幾天AI圈最大的流量都被Meta承包了。
先是4月6日,遲遲不出手的Meta終于亮相,一舉扔出包括Llama 4 Scout( 109B )、Llama 4 Maverick ( 400B )和Llama 4 Behemoth在內(nèi)的Llama 4套餐,憑借“原生多模態(tài)MoE架構(gòu)”“性能超越DeepSeek V3”“1000萬token上下文”等亮點(diǎn),一路高舉高打。業(yè)界也是喜聞樂見,“開源之光依舊能打”等聲音持續(xù)不斷,Llama 4出道即巔峰。
但沒想到,緊接著負(fù)面聲音層出不窮。
一方面,開發(fā)者在實(shí)際測評(píng)時(shí)發(fā)現(xiàn),Llama 4的性能并沒有官方宣揚(yáng)的那樣強(qiáng)大,甚至在代碼、邏輯推理方面,遠(yuǎn)不如GPT-4o、DeepSeek R1 、 Gemini 2.5 pro。
另一方面,有自稱Meta內(nèi)部員工的人員爆料,Llama 4存在造假嫌疑,為了“趕工期”,在后訓(xùn)練階段中,將多個(gè)benchmark測試集混入訓(xùn)練數(shù)據(jù),以提升基準(zhǔn)分?jǐn)?shù)。甚至,技術(shù)負(fù)責(zé)人看不過去這樣的造假行為,遞交辭職報(bào)告。傳聞一出,立即發(fā)酵,Meta陷入輿論風(fēng)波中,各種聲討聲不斷。
一位大模型從業(yè)者在朋友圈發(fā)文稱,“Meta的‘作弊’行為,讓他想到2023年百模大戰(zhàn)時(shí)期。”另有業(yè)內(nèi)人士認(rèn)為大模型和芯片不一樣,一味追求跑分榜單意義不大,大模型的核心能力還是要放到業(yè)務(wù)場景中實(shí)戰(zhàn)。
而經(jīng)過一夜的輿論發(fā)酵,目前,Meta官方已正式做出回應(yīng),Llama 4不存在造假、打榜等行為,模型質(zhì)量表現(xiàn)不一,是有充足的理由可以解釋的,即“我們?cè)谀P鸵粶?zhǔn)備好就立即發(fā)布了,所以預(yù)計(jì)在各個(gè)平臺(tái)的公開實(shí)現(xiàn)需要幾天時(shí)間才能完全穩(wěn)定下來”。
之后,Meta首席AI科學(xué)家Yann LeCun也轉(zhuǎn)發(fā)澄清貼,表明Meta并不存在造假行為。
但是這番解釋并沒有讓大家信服,根據(jù)澄清文,緊跟而來的疑點(diǎn)是,“如果模型還沒有穩(wěn)定下來,Meta為何急著發(fā)布?”
其實(shí),關(guān)于這一點(diǎn),答案很明顯,Meta急了。
在Llama 4發(fā)布之前,Meta上一次發(fā)布新品還是在去年7月,發(fā)布Llama 3.1 405B模型,彼時(shí)DeepSeek仍處于蟄伏期,Meta風(fēng)光無限,CEO扎克伯格也高調(diào)預(yù)告著已經(jīng)處于開發(fā)中的Llama 4。
只是沒想到,今年年初,DeepSeek憑借強(qiáng)大的多場景理解與內(nèi)容生成能力成功“出圈”,AI圈的競爭格局瞬間改變,壓力給到一眾大模型企業(yè),Meta自然也不例外。有消息稱,當(dāng)時(shí)Meta就意識(shí)到,相較于DeepSeek-V3,研發(fā)中的Llama 4 在各項(xiàng)測試中都比不過前者,于是研發(fā)進(jìn)程一再被打亂。
一位業(yè)內(nèi)人士告訴虎嗅,相傳DeepSeek出來后,Meta便在內(nèi)部設(shè)置了四個(gè)作戰(zhàn)室,天天研究DeepSeek,思考該如何復(fù)現(xiàn)其模型能力。另外,這次Meta首次在Llama系列模型中采用MoE架構(gòu),或許也是出于這一路徑早已被DeepSeek驗(yàn)證過。
但顯然,Llama 4的性能表現(xiàn)并沒有達(dá)到預(yù)期,即便是大手筆地用了20萬的顯卡集群。
其實(shí),或許Meta的壓力要來得更早一些。
在Llama 4 造假傳聞出來后,虎嗅在向業(yè)內(nèi)人士求證的過程中,得到的反饋大都是,“這很正常,Meta被逼急了,就只能去作弊了?!?/p>
一位業(yè)內(nèi)人士告訴虎嗅,Llama的危機(jī)感并不是完全是因?yàn)槟瓿鮀eepSeek出現(xiàn)才有的,這只是加速了這一認(rèn)知,其實(shí)早從去年下半年開始,在開源上,Llama系列模型的影響力就大不如前了,開發(fā)者早早就達(dá)成一致,轉(zhuǎn)向性能表現(xiàn)更好的Qwen系列和DeepSeek。
所以,在這次Llama 4發(fā)布之際,大家更多是抱著Meta將帶來怎樣的提升與改進(jìn),并非期待它真的能夠顛覆DeepSeek,重新翻盤。
只是沒想到,Meta不僅沒有讓大家看到它的進(jìn)步,更是因?yàn)橐恍懊曰蟆辈僮鳎屪约荷钕菰旒亠L(fēng)波。
而最新消息是,目前在社區(qū)內(nèi)還有一些開發(fā)者在繼續(xù)試圖找出Meta造假的證據(jù)。
其實(shí),不管這次Meta造假與否,已經(jīng)沒那么重要了,重點(diǎn)是,Llama系列模型已經(jīng)無法再現(xiàn)昔日榮光是真的,Meta面臨著巨大的信任危機(jī)是真的。如果說之前,Meta的壓力與挑戰(zhàn)還在于如何應(yīng)對(duì)DeepSeek和Qwen帶來的沖擊,那么現(xiàn)在,如何針對(duì)Llama 4 存在的性能缺陷,早點(diǎn)修復(fù)Bug,重新奪回起開發(fā)者的信任,才是更為迫切的難題。
原本,這只是AI圈一場事先張揚(yáng)的新品發(fā)布,沒想到卻一波三折,最終演變成一場“鬧劇”,可想而知,這早已背離Meta的初衷。
不知道看到這樣的結(jié)果,Meta是否會(huì)后悔,反正已經(jīng)晚了,又何必在乎再晚一點(diǎn),面對(duì)DeepSeek這樣橫空出世的“大魔王”,焦慮是正常的,如果老老實(shí)實(shí)交出一份誠心之作,即便再不如意,也不會(huì)像如今這般“慘淡收?qǐng)觥薄?/p>
文章標(biāo)題:擰巴的扎克伯格
文章鏈接:https://www.huxiu.com/article/4216259.html
閱讀原文:擰巴的扎克伯格_虎嗅網(wǎng)