關于 DeepSeek 一體機落地真相,我們調研了 12 家上市公司
過去兩個月的一體機市場,一波三折:
曾經半年銷售量兩只手數得過來的一體機業務,在年后一天涌進兩三百人電話咨詢、一周內咨詢近千條,商機密度比往年翻兩三倍,一體機“蜜月期”平等地降臨在各廠商身上。
有行業人士透露,春節以來,中小廠商基本都賣出了十幾二十臺一體機,收入上千萬;運營商能賣出小幾百臺;某大廠定下的目標是,今年賣三千臺。
神州數碼信創業務集團產品中心總經理李川也發現,去年對一體機的需求相對垂直,主要還集中在機器視覺、自然語言處理等領域中小型客戶,今年則向更廣泛的行業蔓延。
業務之外,還有更大的盈利場—— 在二級市場,DeepSeek概念股股價迎來較大漲幅,一體機相關上市公司也一度領漲。 2月以來,浪潮信息、優刻得、神州數碼、云天勵飛等股價陡峭攀升,深信服從半年前的42.70元/股漲到了最高142元/股,云從科技更是一度漲停。(更多一體機相關標的看法,可添加作者微信Ericazhao23交流)
而進入三月,商機有所回落,有運營商的咨詢從每天幾百個下降到每天幾十個;股價也開始跌宕。當用戶從嘗鮮過渡到理性探索,當賣方市場開始產品迭代和探索壁壘,有聲音認為,這個市場即將翻篇。
然而,這并非智算一體機首次爆火,前兩年曾短暫風靡的一體機,能再次殺入大眾視野,絕非偶然。于是,一個問題浮現:當我們需要智算一體機時,我們需要的是什么?
事實上,這個市場需要的不止是AI,還有一體機這種載體——
一方面,對于長期受定制化困擾的中國軟件廠商,一體機通用、弱定制的產品邏輯,有望成為一劑解藥;另一方面,對于習慣購買硬件重資產的本土客戶們,一體機載體也能為其引入AI提供一種安全感。
同時,這場一體機部署熱潮,也是如火如荼發生在B端和G端的AI普及教育,甚至,可以作為AI Agent來臨前的地基建設運動。
“用戶的熱情此前從地上跳到空中,最后大概率會回到桌上”,云天勵飛副總裁羅憶如此形容部署熱潮。當市場情緒逐漸回歸中點,雷峰網 (公眾號:雷峰網) 也完成了多方調研,試圖勾勒DeepSeek一體機市場里用戶的迷茫、廠家的探索,以過去這兩個月的市場為鑒,照見AI一體機蜿蜒向未來的道路。
咨詢熱情高漲,落地層層博弈
新的科技熱潮出現,用戶總需經歷市場教育。
第一個場景,便是賣家的抉擇。
1)急于完成KPI、在廠商間迷失的客戶們
“短、平、快”,是這次一體機用戶的需求特征。
此次部署熱潮中,很多國央企和金融客戶的KPI節奏大差不差:上半年完成部署,下半年應用落地。
部署指令自上而下,時間緊,任務重。焦慮急迫的情緒,從廠商發布的交付數據中可略感一二:聯想集團與沐曦股份聯合發布的首個國產DeepSeek一體機解決方案,一個月內發貨量就超過千臺。
不過,目前很多廠商的成單量跟咨詢量比起來,仍顯寥寥: 多家廠商的DeepSeek一體機成單率遠不如其他成熟產品,有時兩三百個咨詢里沒有一單落成,甚至有的用戶只測試、不下單。
不得不承認,在早期市場上,更吃香的是懂點技術的中間商們。
他們成為香餑餑無非兩個原因:便宜、快速。
但選擇中間商,風險暗藏:很多企業接入大模型的第一步,是做知識問答,而足夠精準的知識問答,要基于精確的RAG(檢索增強生成)框架而做。
然而,現在市面上許多DeepSeek一體機訂單,是由中間廠商直接用MaxKB軟件或Dify平臺給客戶部署。結果上看,也能把知識庫搭起來,但框架往往不夠精確,知識庫里的文字分段有問題,大模型幻覺嚴重:
當專業名詞“阿莫西林”,被切割成了“阿莫”和“西林”,這場幻覺,誰來買單?
困住客戶的不止于此:市面上還有廠家售賣的所謂一體機,只是“計算平臺+推理框架+預裝大模型”,沒有智能體平臺、沒有操作界面,仍是開發機;有的廠家打著滿血版的名義,卻給客戶部署蒸餾的模型;還有的廠家,四處東拼西湊出一體機,交付時卻不負責調優應用。用戶迷茫,做快生意的廠家卻盆滿缽滿。
供給市場魚龍混雜,一個重要原因是,前期一體機的利潤不容小覷。“硬件成本下探空間小,軟件長期服務更盈利”這套一貫的邏輯,用在DeepSeek一體機市場里還不夠全面。有知情人士透露,得益于前幾年英偉達H20囤卡風潮,此次一體機早期硬件利潤不低,一臺滿血版的H20一體機,整體利潤率可達30%。
不過,多位業內人士反映,這一利潤率已在下降。(一體機背后利潤幾何?可添加作者微信Ericazhao23交流)
選對廠商只是第一步,此后還有一系列問題擺在用戶面前:滿血版還是蒸餾版?國產卡還是H卡?訓推一體機還是推理一體機?具體切入什么場景?
每一關都是信息博弈,且每個A和B之間的抉擇,成本也相去甚遠。
2)咨詢時都要滿血版,落地時50%交付蒸餾版
滿血版,是許多用戶的第一個執念——領略過DeepSeek-R1的表現后,大家由奢入儉難。
但滿血版在單臺一體機上的性能到底如何,目前存疑。 用單臺八卡英偉達H20,基于推理框架優化能讓模型順利運行,但性能會有一定損失。還有使用國產芯片的廠商表示,在DeepSeek“話很多”的情況下,一個問題的答案可能要五分鐘才能吐完。
而價格上,滿血版DeepSeek一體機一般在150萬上下,內置國產芯片的還會更高。DeepSeek一體機國產卡的配置,目前以華為昇騰、沐曦、海光較多,但由于國產卡的顯存資源和性能仍稍差,一般要部署至少兩臺才能把滿血版跑起來,預算將近四百萬。這對于規模較小或處于起步階段的企業而言,有些吃虧。
但其實,并非所有人都需要滿血版。
優刻得(UCloud)新興產業事業部首席架構師李天朋觀察到,現階段許多用戶是想把DeepSeek部署用在企業內部的智能問答場景中,預算三四十萬的32B、70B等蒸餾版模型,已能滿足需求,響應速度還會更快。他統計后發現, 最后實際交付時,滿血版和蒸餾版模型比例大概五五開。
而對于什么樣的用戶需要滿血版,他總結道:一類是對模型泛化能力要求高的客戶,比如把DeepSeek用在對外服務上,面向大量用戶;還有成本足夠、希望在本地大規模部署的客戶;以及希望借助DeepSeek模型優化內部算法來提升性能的客戶,比如用來校準交易策略模型。
除此之外,大模型在業務里的“開疆擴土”,也可以交給滿血版。云天勵飛副總裁羅憶說道,開拓一個新業務時,要先讓一位“老法師”把業務跑通,才能安排能力合適的下屬在具體崗位上維系日常運轉,同理,對業務閉環有高要求的用戶,可以先用滿血版把業務跑通,再安置不同的小尺寸模型在合適位置上。
3)訓推一體機價格高昂,并非必要采購
而在引入大模型時,有傳統企業用戶希望訓練自己的模型,于是摩拳擦掌看向訓推一體機——其價格顯著高于推理一體機。然而,在李天朋看來,這對大部分用戶來說都不太必要。
他向雷峰網指出, 純訓練所占的資源至少是純推理的兩到三倍,但DeepSeek的顛覆性恰恰在于推理算力需求的大幅下降,這讓訓推的成本懸殊更大——
DeepSeek如果想跑訓練,對底層硬件要求非常高,需要大顯存和高容量存儲系統等計算資源;然而,由于模型本身的高度稀疏性,在后續推理中,大規模儲備的計算資源又會面臨浪費。
并且,大部分用戶真實使用時,訓練周期相對推理周期非常短,早期的訓練需求可以尋求算力廠商或云廠商租賃資源。除非是有行業知識的垂直領域客戶——如醫院、法律和金融行業——希望用RAG訓練微調DeepSeek,對模型后期訓練有更高要求,下重本選訓推一體機會更劃算。
4)落地場景紛繁,業務適配、技術運維有門檻
本次一體機的部署流程,深信服云計算BG AIC智能計算產品線總經理郜振鋒總結到,用戶一般先小規模采購一批設備部署私有化模型,配提示詞問答和搭內部知識庫系統,AI起步后,再考慮耦合到原來業務系統。
目前,DeepSeek直接接入WPS、企業助手或客服問答場景的頻次最高。但在行業人士看來,普通企業或許沒有必要花這么大成本去“維護”這些數據,加密存儲和云服務的安全措施已能滿足需求。
而真正對一體機采購有剛需的,首當其沖是軍工院所。其次是高端制造業,比如蘋果、華為的供應鏈,應用于生產流程優化、高精度的缺陷檢測等——去到這類場所拜訪時,手機和電腦的攝像頭都得貼起來,離開時若發現貼的紙張有撕過的痕跡,設備就會被沒收,其對安全性的高需求可見一斑。
政府也是此次部署的重要參與者,部分還會通過發函的形式先行先試。這波AI探索中,各部門幾乎都站上了起跑線。有廠商與政府合作的項目正在被趕著交付,因為“內部業務都催著要用”。
目前在政府側,智算一體機的主要用途之一是公文生成和政務服務,如政務審批、咨詢場景。例如,深圳福田就已在DeepSeek政務大模型基礎上,上線70名“數智員工”,縮短公文審核時間90%。而此前在信息領域已有積累的數據局和公安部門,需求相對更明確“激進”——例如,公安部門的DeepSeek部署已能應用在預警、接警等環節中,幫助完成警情分類,或風險防控、偵查打擊等。
金融、醫療等行業也是更明確自己一體機需求的用戶,有客戶會一次性提十臺八卡一體機。
金融在信息化領域一直走在前列、也有較多預算支持,在此次部署中占據很大比例。目前,金融接入大模型,更多用于對內管理提效;在涉及財務分析等數值計算場景,很多用戶還不敢直接使用DeepSeek模型。火山引擎在交付時還發現,許多金融客戶還會關注在智能體的應用開發上。
騰訊TCE產品專家叢磊也指出,銀行等金融機構本身已有千卡規模算力,DeepSeek對算力的需求變小,這一技術迭代給銀行帶來的挑戰是,怎么用原來跑訓練集群的算力,創造更多好的推理場景。
而醫療上,一體機能輔助導診、對接藥物數據庫、實現細粒度的專科診斷,或幫忙自動總結病歷等。
至于能源、電力等領域,主要落地場景是用戶的生產和安全管理。比如安全監控系統,以前單靠算法逐個預警,產生報警后又需相關人員逐個確認排查;但現在,大模型能進行全流程編排,自動生成作業報表,呈現所有環節的情況。并且,DeepSeek接入工控和質檢系統時基本時延要求都在50ms以下,調取API的方式很難滿足。
整體來說,對性能需求不高,但對數據安全或訪問延遲敏感的場景用戶,更適合一體機。此外,不以業務閉環為目標、更注重科研和技術探索的場景,如科研院校、創業公司和開發者,也是一體機的目標客群。
場景適配后,要真正駕馭一體機,還有一道不容忽視的門檻:技術資源。
此次部署熱潮中,羅憶就發現,一大半咨詢的用戶在過去兩年里,對大模型的運用仍停留在觀望狀態。
這導致一體機落地時可能水土不服:部署一體機確實是“小時級”工程,畢竟點亮服務器的動作,半天、甚至半小時就能完成。但在這之后,要跟企業自身OA系統對接,還要后續運維,尤其接入具體業務時,DeepSeek工程化能力越好、專家模型就越多,就更需要通過調優找到性價比最高的方式。很多企業一通咨詢后,發現自己根本沒有技術能力去維護,遂作罷。(一體機真實落地體驗如何?歡迎添加作者微信Ericazhao23探討分享經驗)
接入大模型并非一朝一夕,當廠家沒能掌握用戶具體的業務邏輯,當用戶本身的數據治理和業務梳理不夠準確,DeepSeek一體機和業務的結合就會出現鴻溝。可以想象一體機是個新來的實習生,企業本身如果沒有成體系的業務梳理,實習生又如何盡快上手?
也因此,在羅憶眼中,過去兩年在大模型結合應用落地上已有探索的客戶,可以稱得上是“好客戶”:除了前期的數據治理等工作,他們可能已為系統上線建立測試集;更徹底些,有的用戶這次只是把之前部署的大模型,切換成DeepSeek。
廠商生存之道:爆發初期,尋求行業的差異化
一個多月爆發六十多家廠商的一體機賽道里,各家如何殺出重圍?
一個大方向是,廠商們都重視提供軟硬一體的解決方案,幫助客戶落地到具體場景。例如火山引擎提供其機器學習平臺給用戶進行模型開發,也集成其應用構建產品,推動落地;神州數碼旗下神州鯤泰在提供匹配不同客戶需求的“全家桶式”一體機解決方案時,也結合企業自研的AI原生賦能平臺,為用戶從PaaS層提供模型選型、多種模型軟件適配和調優等能力。
但具體到軟硬件基因,不同類型廠商已天然有各自的優勢。
云廠商做一體機,除了軟件調優、模型管理等方面是強項, 還能給用戶的DeepSeek適配提供“一條龍”服務 。羅憶便建議道,用戶部署一體機前,先租用云廠商的算力資源測試,驗證模型能接入業務閉環,再選擇合適的部署方式。
但云廠商的硬件并非自有,對此,UCloud的做法,便是由專門的硬件團隊與多家硬件供應商對接,再和模型算法開發團隊探索硬件解決方案。供應商按交付需求提供個性化硬件后,UCloud再預裝推理引擎、算力調度等功能。
反觀硬件服務器廠商,在軟件調優能力上可能不占優,但勝在硬件建設成本和國產化適配。并且,其早期在售賣信息中心服務器時積累下的用戶, 在客群和硬件基因上之契合,使他們更可能一脈相承成為后續買家。
一些ERP廠商如用友、漢得信息等,在此次部署中,也能因其早期客情積累而吃香。
不過,許多從業者坦言,廠商雖出身不同,但目前一體機的技術差異并不大。
理論上,各家核心競爭力應是推理大模型的效率指標和性價比,例如每用戶的首次響應時間、能跑多少并發、每個并發能處理的最大上下文是多少等。
但在一體機爆發初期,市場具體性能指標并不透明,真實數字也不太好看:據悉, 目前首次在本地加載DeepSeek滿血版可能要四五十分鐘,而DeepSeek-R1在線服務每個并發能處理的最大上下文可以達到128K,但線下私有化部署,量化版本基本只能達到16K。
新產品調優需寬容更多時間,目前談技術指標為時尚早,廠商們著力尋找差異化的方向,一個是 誰更“輕” 。
市面上尤其大廠的產品,大多主打“全棧”。有行業人士透露,有的大廠一體機產品或需至少三臺服務器來管理。也因此,誰更輕量化,給用戶帶來的成本負擔就更小。浪潮云海起初推出的也是三四臺部署方案,但觀察到許多用戶會先選擇落地一臺,“想節約資源,避免犯錯”。百度智能云便提出,在私有化部署層面搭載昆侖芯P800的百舸、千帆、一見的一體機產品,可支持單機環境下一鍵部署DeepSeek R1/V3全系列模型。
而對于中小廠商, 目前各家廠商抓住的差異化,主要是在細分領域的行業認知 。
例如,通用一體機之外,云從科技還會融合自己在公安、政務領域的行業積累,以“一體機+Agent”的形式交付巡檢一體機、智能制造一體機。
這是中小廠商的游擊戰策略:通用一體機領域,定制要求低,客戶觸達量高,硬件配置又高度同質化,多重buff疊加,價格戰幾乎是無可避免; 而研發一體機在垂域行業里的應用,讓一體機搭載更多行業智能體,議價能力也會更強,未來甚至可能比通用的價格貴上幾倍 。
有的廠商也會通過和生態伙伴合作,拓寬其在具體行業內的深入探索。大華股份智能產品負責人任成介紹道,公司深耕智慧物聯領域,在推出Deepseek一體機后,收到來自全行業的廣泛咨詢,于是以“大華+伙伴”的形式將Deepseek與場景化行業業務結合:由大華提供算力資源+大模型能力底座,協同生態伙伴的Know-how專家服務和業務應用,打造專業場景下的大模型整體方案。深信服也和ISV深度合作,以其AICP算力平臺作為承載,由廠商加上應用組件,形成整體交互方案。
完整的“AI物流業”,就此形成。(一體機生意對上下游還有何影響?歡迎添加作者微信Ericazhao23交流)
不過,多位從業者也指出,隨著用戶側一體機部署規模增大,單機運維成本上升,用私有云統一運維是性價比更高的方式。許多一體機廠商也已在為此布局。
浪潮云海DeepSeek超融合一體機便搭載云智能體管理平臺,定義AI應用智能體要素,讓用戶像運維虛擬機一樣管理AI應用,幫助用戶實現知識庫高效構建,滿足傳統應用+智能體混合運維需求。
深信服團隊雖然也早早完成對DeepSeek的適配,但為了讓用戶能利用原有超融合產品快速上線,他們主推的DeepSeek解決方案是:讓用戶在原有超融合上擴展一臺GPU升級為智算平臺,或通過深信服的托管云快速申請線上資源和服務,或用AI創新平臺把DeepSeek結合進自己業務中。
放眼望去, 和云密不可分。
另外幾家云大廠的Deepseek一體機也都在云產品線里,例如火山引擎的DeepSeek一體機由其內部混合云產品孵化,百度的解決方案則來源于百度智能云,還有阿里云、京東云等。
騰訊則沒有推出一體機的硬件部署方案,仍以其專有云TCE和分布式云CDC的方式為客戶提供本地部署服務。騰訊分布式云專家賈卷向雷峰網表示,市面常見的DeepSeek一體機形態與云的原生架構不一致,相比一體機形式,基于云架構的方案能覆蓋更多客戶場景,“DeepSeek出圈的速度非常快,很多業務團隊考慮的是怎么盡快跑起來,但當業務擴大、需求豐富時,方案是否還能承載就未知了。”云服務能提供豐富的IaaS和PaaS形式的AI服務,更方便用戶業務從單臺、單機柜方案過渡到大集群的正式業務。
而 “一體機+云”的布局,在部分市場分析師眼中,也是更可持續增長的邏輯 ——云能提供靈活的計算資源分配,未來更可能成為Agent的載體。
一體機需求背后,市場的重資產基因
這波一體機的市場狂歡,也部分得益于此前市場給用戶進行過的“預期管理”。
2023、24年,智算一體機也曾風靡市場,但彼時沒有足夠全民性的大模型,各家廠商的一體機價格昂貴,單臺一體機動輒四五百萬,且往往需要多臺部署才能把大模型跑起來。成本之高,讓企業望而卻步。
相比之下,DeepSeek一體機的價格就顯親民,瞬間點燃市場熱情。
不過市場是否有足夠購買力,一個關鍵因素是,下游客戶們的IT預算有無增長。大多數企業的IT預算在一體機市場爆發前已經規劃好,ROI(投資回報率)尚不清楚的情況下,預算投入不會貿然增加。羅憶就發現,許多用戶這次購置一體機的資金,其實是年前計劃購買閉源大模型的資金。
整體上,政企客戶的支付能力并沒有變強,這也導致了,很多用戶都想先拿樣機去用,一體機在短時間內的回款可能卡殼。 (一體機是不是賺錢的生意?歡迎添加作者微信Ericazhao23討論)
而隨著一體機落地增多,其局限也逐漸展露。
首先,DeepSeek一體機孤軍作戰成果有限。除了要結合數據庫等PaaS層產品,真正切入核心業務時,往往需結合領域專業模型使用。不同業務領域專業模型各異,這就決定了客戶未來的需求是多模共存。
但, 目前市面上的大部分一體機,若想同時運行多個模型,可能存在性能問題。
而對于已有大模型的用戶來說,是否需要切換DeepSeek也因場景而異。郜振鋒提到,根據深信服自身以及與客戶、行業ISV交流的經驗總結,在需要大模型實現一定推理任務的場景里,切換到DeepSeek大參數模型后的效果優勝;但在一些相對通用的場景,如醫療導診,僅是根據用戶癥狀指引科室等工作,使用其他小參數量大模型,也能有不錯效果。
其次,模型的迭代更新對硬件也是個挑戰。
上層大模型持續更新時,有穩定后續服務的廠商,能幫企業在一體機上迭代。但從硬件現實上看,隨著大模型發展,可能導致原有一體機算力資源不足。大華股份此次為客戶交付DeepSeek大模型產品時,就發現許多中小型用戶如果想跑滿血版671B,都需要對現有機房中硬件進行大量升級改造。
而規模的擴展上,硬件部署也容易成其硬傷。
一臺智算一體機一般被視為一個節點,然而,私有化部署進行高負載任務時,很難單節點作戰。根據DeepSeek發表的論文,其推理系統采用跨節點的專家并行策略來實現高吞吐和低延遲,在大規模推理任務中,需要多個節點集群來優化性能。但AI一體機的架構,也容易局限其節點的擴展。
李天朋也表示,一體機并非最適合跑DeepSeek的載體。由于MoE模型的特性,一臺顯存足夠大的一體機裝上671B,每次每個token激活的計算只有37B,稀疏度很高,存在大量資源閑置。
由此,單純堆砌一體機,帶來的性能增長或許難成正比。對性能要求非常高的用戶,或許需要自建計算集群。
云從科技的董秘楊樺觀察到, 很多部署了一體機的用戶感受就是降本增效了,“但如果說立馬到了一個美好的人工智能時代,那好像也沒有”。 但濾鏡破碎后,真正的普及教育才剛剛開始。
而放眼整個市場,一體機也為部分“舊疾”帶來新藥方。
對ToB軟件交付廠商而言,此前國內市場存在嚴重的項目定制化傾向,用戶需求千差萬別,企業一不小心就會成為客戶的“外包”,導致所做項目難以推廣、毛利不夠。 而一體機形態的出現,讓一些在軟件方面有行業積淀的解決方案廠商,有了“軟硬一體”、能復制推廣的通用產品邏輯。
楊樺還發現,這種載體還讓其部分需要硬件“安全感”的用戶感到滿足。這也符合市場國情: 中國市場向來重視重資產的投入 ——其作為企業的長期資產,本身具有一定賬面價值,在經濟下行時可以作為緩沖,也有助于提升企業市值,屬于更長期主義的產品邏輯,在心理上能成為托底。
另一方面,這也讓國產智算算力相關廠商,燃起信心。
此前,行業的核心痛點是跑國產卡。國產芯片受制于先進制程,單顆芯片的算力難以與英偉達等高端GPU相比,但通過C2C或D2D技術,這些小芯片能高速互聯,形成類似大芯片的計算能力。盡管,國產算力和DeepSeek的適配上,還沒能有效把算力和帶寬的資源用足,但 DeepSeek在推理階段的算力需求較低,至少已指明這類分布式芯片有承接大模型推理的能力。
此外, DeepSeek推理模型改變了對高額投入和高端算力的依賴,開源模型也讓中小云廠有了幫客戶部署大模型的新生意 ,這讓在大云廠商縫隙中艱難生存的中小云廠,也有機會進入這個市場。盡管,毫無疑問,他們依然需要打游擊戰。
而在客戶側,借著這波一體機風潮,在Agent元年的開端,私有化部署的硬件設施得以加速走入用戶側。
在浪潮云海產品部總經理龐慷宇看來,一體機未來將會作為AI集群存在,用戶再從私有云上調取PaaS和IaaS資源,以“大模型+智能體的方式”接入業務流。
可見,一體機更長遠的未來,是Agent這片星辰大海。楊樺也相信,未來,軟件市場會基于“開源DeepSeek+閉源模型”重塑,把應用都升級為Agent。
而這也是二級市場希望看到的:Agent在應用形態和場景上的更新。 有分析師指出,因為Agent極大可能誕生于國內大廠,因此,部分和大廠綁定的上市公司值得觀望。此外,ERP公司的產品業務流程足夠復雜,能涉及供應鏈管理、財務等,垂域行業Agent也更可能在這里發生。
AI Agent汽笛聲遠遠傳來,廠商狂奔而去。在此之前,一體機正在打下地基。
作者持續關注DeepSeek一體機市場需求、落地體驗等情況,以及云計算及上下游相關,更多信息可添加作者微信Ericazhao23交流。
雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。