王小川的第一個 AI 應(yīng)用來了!主打 AI 搜索 + 智能助手
百川智能已經(jīng)成立超過一年了,據(jù)媒體報道,估值已經(jīng)超過 130 億人民幣。
盡管作為頭部大模型公司,百川智能曾被朱嘯虎點名為「技術(shù)也靠譜,創(chuàng)始人也靠譜」,普通用戶對百川智能的技術(shù)和產(chǎn)品感知并不強。
其主要原因是,在此之前,百川智能并沒有推出一款文心一言、Kimi 智能助手這樣鮮明的針對 C 端用戶的產(chǎn)品——直到昨天。
5 月 22 日,百川智能在北京召開發(fā)布會,發(fā)布自己的最新模型 Baichuan 4,并同時推出了自己的首款移動端應(yīng)用——百小應(yīng)。
百小應(yīng)的定位為 AI 智能助手,與文心一言、Kimi 智能助手相似,但主打的特點是「懂搜索、會提問」,這點又與目前很火的 AI 搜索應(yīng)用類似。
百川智能表示,并不想做普通的 AI 搜索——將搜索網(wǎng)頁結(jié)果聚合起來,由大模型進行匯總,提供一個答案。而希望用搜索的能力,強化助手的概念。這讓百小應(yīng)的設(shè)計與普通 AI 搜索略有不同。
比如,在百小應(yīng)的產(chǎn)品設(shè)計下,百小應(yīng)會更希望能在用戶提問后,對用戶進行進一步追問,不在一輪搜索中,多抓取網(wǎng)頁結(jié)果綜合比對直接作答,而是通過多輪對話,獨有搜索技術(shù),通過搜索少量網(wǎng)頁,精準地回答用戶的問題。
除了能夠搜索之外,百小應(yīng)還能完成代碼撰寫、主題創(chuàng)作、活動策劃等一般 AI 助手能完成的任務(wù)。
在 AI 圈的大新聞——國內(nèi)大模型 api 紛紛降價的大背景下,此次百川智能推出了新模型,是否降價也受到了關(guān)注。不過在發(fā)布會上,王小川顯得很淡然:「百川而言,API 是收入非常少的事情,也不會構(gòu)成我們收入的重點。我們最終希望用超級模型,做出超級應(yīng)用。因此對于國內(nèi)大模型 API 調(diào)用降價,是吃瓜的態(tài)度。」
不過,王小川承認,此次推出的 Baichuan 4 和百小應(yīng),都還沒有達到他心目中理想的「超級模型和超級應(yīng)用」。「 會有人問我是不是發(fā)應(yīng)用發(fā)晚了,我其實覺得發(fā)早了。我認為大家之前發(fā)的各種應(yīng)用只是模型的展示 ,大模型行業(yè)的 C 端應(yīng)用都還在為百萬 DAU 努力,行業(yè)沒有成熟。」王小川表示。
對于此次發(fā)布的百小應(yīng),他表示這是一個能讓行業(yè)內(nèi)對百川智能有基礎(chǔ)了解的機會,也是一個能讓團隊「轉(zhuǎn)起來」的機會。「 如果順利的話在今年內(nèi)會有大的升級變化,到時候的應(yīng)用能夠解決大家的剛需。 」王小川表示。
百川智能行不行?用戶可以親自驗證了
百川智能此次發(fā)布的百小應(yīng),取名自「一呼百應(yīng)」,代表了百川智能希望 AI 助手能夠真正解決人們的問題的愿景。
在 AppStore 里,目前就能下載到這款產(chǎn)品。
圖片來源:截圖
可以看到,百小應(yīng)的應(yīng)用,開屏主打,就是其搜索功能。
筆者簡單試用了一下這款 app。與 AI 搜索應(yīng)用不完全相同的是,在對百小應(yīng)進行提問的時候,不一定會觸發(fā)搜索功能,比如,在提問「百川智能是一家什么樣的公司」時,百小應(yīng)應(yīng)該是調(diào)用了自己的知識庫,直接給出了回答,而沒有觸發(fā)搜索功能。
在觸發(fā)搜索功能時,相對于筆者用過的搜索產(chǎn)品,百小應(yīng)閱讀網(wǎng)頁的時間似乎相對較長,但是生成回答的速度相對較快,給出的回答,也相對較長且結(jié)構(gòu)化。
比如在詢問「高通有哪些產(chǎn)品線」這一問題的時候,百小應(yīng)給出的結(jié)果有八百多字,而秘塔搜索的「深入」模式(共有簡潔、深入、研究三種模式)給出的回答大概為六百多字。Kimi 的回答大概五百多字。
在手機上看百小應(yīng)的回答,要下拉三屏,第一反應(yīng)還是感覺非常詳細。
圖片來源:截屏
和另外兩個產(chǎn)品相比,百小應(yīng)的另一個特點是,搜索的網(wǎng)頁比較少——似乎在百小應(yīng)的產(chǎn)品設(shè)計里,一輪搜索就是四個網(wǎng)頁。
因為搜索的網(wǎng)頁比較少,如何判斷搜索的答案的精準性,也是百川智能的一個重要技術(shù)方向。百川智能表示, 百小應(yīng)的搜索背后有一些獨特的能力,尤其是定位問題領(lǐng)域,訪問權(quán)威網(wǎng)站的能力。「它搜索的時候不是只調(diào)用通用搜索,而知道在關(guān)鍵時候調(diào)用一些更關(guān)鍵的搜索引擎獲得答案。」 王小川表示。
在上面的搜索中,這一點似乎有所體現(xiàn),在高通這一問題的四個網(wǎng)頁中,其中第三個網(wǎng)頁,是一個高通的官網(wǎng)鏈接,最后的回答,也主要以高通的官網(wǎng)鏈接,作為了主要參考。
而在我的另一部分搜索中,百小應(yīng)會搜索八個網(wǎng)頁——產(chǎn)品會顯示「做了兩輪搜索」。
這似乎也是百川智能搜索方向的一個獨有設(shè)計。「 我們做兩輪搜索,是先搜一個詞,獲得答案或者啟發(fā)之后,會激發(fā)它根據(jù)之前的搜索回應(yīng),進行第二次搜索。 」
百川表示,百小應(yīng)的另一部分獨特能力,在于會提問。
百川智能自己提供了一個真實用戶案例。「我們的員工問了百小應(yīng)一個問題,引擎蓋打不開了怎么辦。國內(nèi)流行的模型,回答大同小異,會提供一些辦法。但是百小應(yīng)會問你車的品牌以及型號,以及是哪年的車,然后去具體搜索維修點信息等等。」
?
圖片來源:百川智能
這樣的能力,確實在一般的 AI 搜索上較為少見,在一些商品信息推薦的應(yīng)用上,則有所使用——在用戶搜索推薦某個價位的耳機后,進一步詢問用戶的需求是室內(nèi)還是戶外。
在未來 AI 助手為人們提供更個性化服務(wù)方面,這樣的功能,似乎是一個重要的組成部分。不過此次我在和百小應(yīng)的聊天中,百小應(yīng)追問能力表現(xiàn)并不明顯。而對于用戶而言,是否愿意打破之前搜索的習慣,多打字進行多輪回答,似乎也是一個未知數(shù)。
百小應(yīng)也有普通的 AI 助手會出現(xiàn)的弱點——在對網(wǎng)上信息不足的問題進行搜索時,AI 很難給出準確的回答,甚至會一本正經(jīng)地胡說八道。
王小川表示,目前的解決方法也只能是提供「引用校驗」。當 AI 提供的回答嵌入了搜索結(jié)果的時候,后面會打個標,來自什么樣的網(wǎng)頁里面,由用戶去判斷其可靠性。
在之前的 極客公園直播 中,獵豹移動董事長兼 CEO 傅盛曾提到,部分 AI 搜索產(chǎn)品雖然會提供引用校驗,但實際上標內(nèi)內(nèi)容與實際回答對不上,而在百小應(yīng)中,引用標記并不是對應(yīng)網(wǎng)頁,而是直接對應(yīng)到網(wǎng)頁的特定文字,應(yīng)該能為用戶提供更強的可靠性。
Baichuan 4:發(fā)布首日SuperCLUE登上榜首
此次為百小應(yīng)提供產(chǎn)品背后的搜索模型的,是百川新發(fā)布的 Baichuan 4 模型。
進入 2024 年,百川將新模型的發(fā)布節(jié)奏從每月變到每季度。上次百川發(fā)布新模型,還在 2024 年 1 月,發(fā)布 Baichuan 3 模型。
百川智能表示,相較 Baichuan 3,Baichuan 4 在各項能力上均有極大提升,其中通用能力提升超過 10%,數(shù)學和代碼能力分別提升 14% 和 9%。
「SuperCLUE 目前是中國最公正的榜單。從結(jié)果上看,Baichuan 4 在 SuperCLUE 里理科目前排國內(nèi)第一。文科因為是中文模型,明顯有更大的優(yōu)勢,處于全球最好的位置。」王小川表示。
不過王小川的發(fā)布顯然比較切近實際,并沒有夸張宣稱超越了 GPT-4:「在 SuperCLUE 上我們拿到第一,數(shù)據(jù)是真實的,但是并不代表能力上超過了 GPT-4。 和國外模型作對比,能看到像知識百科、文本創(chuàng)作或者安全里是遙遙領(lǐng)先的,在代碼、邏輯這幾條線條里可以看到國際模型更加領(lǐng)先。 」
圖片來源:百川智能
Baichuan 4 模型有千億參數(shù)規(guī)模,是閉源模型。「開源是我們?nèi)ツ炅⑼睹麪顣r的一個動作。」王小川表示。
值得一提的是,此次百川也公布了自己的多模態(tài)方面的數(shù)據(jù)。
之前百川智能一直表示,智能源自語言,也曾公開宣布不追 Sora 這條技術(shù)線。
此次雖然王小川仍然堅持「多模態(tài)不具有智能。今天語言用著用著可能沒數(shù)據(jù)了,人們在嘗試是否能在圖像視頻里面能產(chǎn)生智能。不過,語言是白粉的話,圖片就是面粉,它在里面蘊含的智能濃度低太多。」,仍然簡單發(fā)布了 Baichuan4 的多模態(tài)能力,表示其多模態(tài)能力在各大評測基準上表現(xiàn)優(yōu)異,領(lǐng)先 Gemini Pro、Claude3-sonnet 等多模態(tài)模型。
圖片來源:百川智能
?
百小應(yīng),只是一個過渡產(chǎn)品
曾經(jīng)提出過在大模型領(lǐng)域里頗具影響力的 TPF 理論(大模型時代,更重要的是找到技術(shù)和產(chǎn)品的契合)的王小川,此次終于帶公司推出了第一款面向 C 端的產(chǎn)品。
搜索,一方面是百川智能一直以來強調(diào)的強項——百川智能 CEO 王小川曾任搜狗 CEO,在搜索領(lǐng)域深耕十幾年。王小川強調(diào),目前,百川能自建搜索能力,且在數(shù)據(jù)方面也有合作伙伴,這兩方面都是百川智能的優(yōu)勢。
另一方面,搜索也是市場驗證過的幾個較為成功的 AI 應(yīng)用場景之一——國外的 Perplexity.ai,國內(nèi)的秘塔搜索等等,都是目前收獲不少用戶的明星大模型創(chuàng)業(yè)項目。
搜索領(lǐng)域,或許確實是百川智能不錯的 TPF。
不過,在整個發(fā)布會上,明顯能感覺到,百小應(yīng)這種形態(tài),并不是百川智能未來想做的超級產(chǎn)品。百川智能只是想把有搜索能力的助手作為未來超級應(yīng)用的第一步——王小川定義這樣未來的超級應(yīng)用,應(yīng)該是能解決人們的剛需的,能擁有近億級用戶。
不過究竟這樣的應(yīng)用是怎樣的,未來是怎樣的商業(yè)模式,王小川相對含糊其辭。其中「職業(yè)人士」這個詞被提及多次。真正的超級應(yīng)用,似乎是要等到模型能力足夠成熟之后,替代「職業(yè)人士」才能出現(xiàn)。
「如果 AI 能像人一樣工作像人一樣學習,最后就會變成一個職業(yè)人士,往下會變成 AI 律師,AI 醫(yī)生,AI HR,這種情況下跟人一樣能提供人的供給,我覺得這種時候就可能出現(xiàn)超級應(yīng)用。」 王小川表示。當人們用醫(yī)生的價格去衡量 AI 應(yīng)用,而不是用娛樂價值、算力成本等方法來衡量 AI 應(yīng)用,那確實將是用戶付費率高漲的時候。
而在今天,百川推出百小應(yīng),似乎還沒有開始擔心商業(yè)模式的事情。
「做百小應(yīng),是在這個行業(yè)中,我們也需要有一個機會把它發(fā)上去,讓行業(yè)端有基礎(chǔ)的了解,也能讓團隊轉(zhuǎn)起來。」王小川表示。
他還表示,從成本上而言,做搜索,建立索引庫的技術(shù)成本相對是可控的。「現(xiàn)在最大的成本其實是在 Scale Up(把大模型參數(shù)規(guī)模做大),大模型中間的實驗加上 Scale Up 這個錢,這個是遠大于其他地方的。」
「我覺得現(xiàn)在談商業(yè)模式是過早的事情。沒有足夠的用戶價值、足夠的體量,在這個情況下,不管是走流量模式,還是廣告模式都是有意義的探索,但是我覺得有或沒有,其實沒有本質(zhì)的區(qū)別。」王小川表示。
?
?