百川智能首款 AI 應用主打懂搜索,但王小川不做搜索 2.0
「雷峰網 (公眾號:雷峰網) 」二十多年前,搜索引擎的發明極大地方便了人們獲取信息,很快搜索引擎便成為互聯網時代第一流量入口,谷歌、百度更是憑借搜索引擎在 PC 互聯網時代占據統治地位,成為兩大巨頭,多年以來,兩者在搜索方面的地位無人能撼動。
ChatGPT 問世后,OpenAI 背后金主微軟率先將 GPT 模型集成到旗下Bing 搜索引擎中,自此拉響了重塑搜索的警報。
看到機會,國內外很快便出現了一批 AI 搜索產品,例如此前大火的Perplexity、秘塔、360 搜索、天工AI……可以說 2023 年是 AI 搜索元年。
Perplexity、秘塔這些 AI 搜索產品他們應該都做過同一個夢:顛覆傳統搜索。
近日,大模型明星創業公司百川智能也發布了一款號稱“懂搜索”的 AI 助手「百小應」。讓人頗受關注的是,百川智能創始人王小川,在上個互聯網時代因為做出了搜狗搜索而聲名大噪,此番入局大模型創業,首款產品跟搜索相關,完全在情理之中,在大家的認知里,如果在國內選兩個最能做好AI搜索的人,其中一個必然是王小川。
但意料之外的是,王小川表示,百小應不是對傳統搜索的升級,他不做搜索 2.0。
“大模型創造的是新物種,要讓 AI 從工具變成伙伴,而百小應就是一款在模型能力有限的情況下從 AI 工具到 AI 伙伴的過渡型產品。”
在實踐上他也很知行合一,跟 Perplexity、秘塔這些用大模型提升AI搜索體驗的產品不同,定位AI助手的百小應是把搜索作為一個提升回答準確性、豐富性的工具。
百小應,一個懂搜索的AI助手
搜索不僅能讓大模型實時獲取最新信息,還能有效解決大模型的幻覺問題,是大模型落地應用的關鍵技術之一。
但如何在AI應用,尤其是AI助手類產品中用好搜索,不同的企業卻有著不一樣的理解。在百川智能認為,今天的 AI 搜索產品更多是搜索聚合,即把搜索結果做總結,但這樣是不夠的,從用戶體驗的角度來看,AI助手需要能像人一樣掌握專業的搜索技能,利用好搜索這個工具,也就是“懂搜索”。
在此基礎上,還需要具備“會提問”的能力,讓模型能清晰引導用戶表達自己的需求。傳統的搜索更多是通過關鍵詞去搜,無法理解關鍵詞背后用戶的獲取信息的意圖。今天通過大模型用自然語言去對話、交流,讓機器具備了理解我們的意圖的能力,但這個過程中很多時候用戶表達不清晰、不準確,導致用戶對一些搜索結果仍然不滿意,對此「百小應」可以通過提問、反問的方式去引導用戶將需求表達的更具體、清晰,進而得到更準確的結果。
為了能夠用好搜索工具,百川智能為「百小應」打造了定向搜索、多輪搜索等能力,不僅讓「百小應」能夠在與用戶的交流中自主思考是否需要調用搜索工具,還能主動決策應該采用哪種搜索行為。
例如問「百小應」“幫我找下《斗羅大陸IV終極斗羅》的資源?”,它能精準定位你的問題領域——電子書、有聲書、視頻領域,能直接訪問權威網站,在網站中產生搜索,最后定位到拉看書網、有聲聽書網、嗶哩嗶哩,點鏈接就能進入到網站:
這是「百小應」采用了定向搜索的策略,它搜索的時候不是泛泛的查找,而是直接查找與《斗羅大陸IV終極斗羅》資源最相關的網站。
面對復雜的問題,人會根據之前的搜索回應,進行第二次、第三次甚至更多輪次的搜索,百小應也擁有這種能力,針對用戶提出的問題,「百小應」在得到搜索結果之后會結合用戶的問題進行反思,自主判斷當前資料是否足夠詳實,進而自主決策是否需要進行更多輪次搜索獲取更多信息。
相比單輪搜索,在市場調研、產業分析等復雜場景下,多輪搜索能夠有效地獲取更專業、更有深度的信息。
在搜索結果呈現方面,「百小應」同樣與其他在單次搜索后“簡單總結網頁信息”的應用不同,它是將搜索結果作為問答的參考資料,將“搜索結果嵌入回答”,從而使回答更加清晰、飽滿。
例如讓「百小應」分析“新能源汽車市場格局,小米入場后有什么影響”,它便會將搜索到的數據直接引用到回答當中作為數據支撐的一部分:
在會提問方面,百小應能夠在用戶問題的基礎上通過一系列提問來幫助用戶明確自身需求。例如問「百小應」“車門打不開了怎么辦?”,它會先問你車的品牌以及型號,是車內打不開還是車外打不開?你告訴它車品牌型號和車內打不開之后,它會針對性的告訴你正確的開鎖方法:
「百小應」還非常具有“理科”思維,很擅長將結果結構化呈現,如下圖:
除了懂搜索和反問功能以外,用戶還能在「百小應」中上傳PDF、word文檔,或者直接輸入網頁鏈接(URL),閱讀并分析書籍、報告、學術論文等長篇內容,僅用一分鐘便能讀完上市公司財報:
用戶在提問的同時還可以同步上傳圖片,對圖片內容進行解讀,或者將圖片作為補充材料,獲取更精準的回答;并且,它還支持用戶通過語音的方式進行交互。
王小川認為,如Perplexity、秘塔這些產品做的都是搜索總結類的工作,搜索引擎公司自己就能干。如果只是搜索結果的總結,就只是對傳統搜索的升級,在價值創造和競爭力上,無法跟傳統搜索大廠競爭,這不是今天創業公司或朝著 AI 伙伴前進路上 AI助手應該做的事。
“AI 助手正確的路徑是嵌入搜索結果,而不是總結搜索結果,要把搜索結果作為觀點、論點、論證,跟模型的結果融合在一起。”
這種判斷背后是王小川對大模型時代的超級應用的思考,他認為,要讓大模型像人一樣思考,超級應用應該朝著伙伴方向走。
大模型時代,王小川眼里的超級應用?
從創立之初,王小川就一直提百川要有自己的超級應用。
相比互聯網時代動輒上億用戶的應用,當下一個擁有 100 億 DAU 的 AI 產品就能引起轟動,但王小川認為現在超級應用還未出現,從用戶體量上看還得再提升兩個數量級,DAU 達到 3 千萬到 3 億之間才能稱之為超級應用。
“當下最火的兩款應用,微信擁有 13 億+DAU,抖音擁有 4 億+DAU,大模型時代的超級應用應該是如抖音這樣的一個產品。”
過去做輸入法、搜索引擎、瀏覽器的經歷,讓百川智能知道一個應用到什么程度才會變成一個被廣泛使用的產品。
如果「百小應」要成為一個超級應用,王小川認為應該具備以下特點:
首先,模型能力能達到 60%-80% 的可靠性,未來模型一定要和搜索做結合,因為模型是一個推理引擎,有了搜索之后,它的知識的廣泛程度和真實度都能得到提升。
第二,作為助手能充分理解用戶的意圖,變成某個行業的專業人士一樣。AI 能像人一樣思考、工作、學習,最后就會變成一個職業人士,例如法律助手、醫療助手。
接下來,對于「百小應」王小川稱并不會通過營銷戰術去宣傳,他認為一些廠商發產品可能是為了拉融資,這不是一種健康的方式,百川會把精力放在打磨產品、發掘產品價值上,做出真正好的產品。
百川的“雙輪驅動”
“超級模型+超級應用”的雙輪驅動一直是百川智能的發展理念。而此次「百小應」發布,剛好補齊了應用上的拼圖,百川智能可以算是真正走到“雙輪驅動”的路上。
雖然現在既沒到超級模型,也沒到超級應用,即便「百小應」還只是一個過渡型的產品,但王小川稱團隊心中有超級應用的畫面感,尤其是從去年4月份工作到今年5月份這一年的時間,團隊有足夠的手感。
超級應用的誕生,最根本還是要看模型能力。
在模型基礎能力層面,百川智能一直在持續升級。此次跟「百小應」一起發布的還有 Baichuan 4大模型,作為百川智能發布的最新一代基座大模型,Baichuan 4相較上一代大模型Baichuan 3在各項能力上均有顯著提升。其中通用能力超過 10%,指令跟隨提升20%,信息理解提升9%,知識問答提升15%,創作提升16%,邏輯推理提升15%;專項能力方面,數學提升14%,代碼提升9%。
此外,在國內權威大模型評測機構SuperCLUE的評測中,Baichuan 4模型能力國內第一。而此前,在 SpuerCLUE 發布的“中文大模型基準測評2024年4月報告中”,Baichuan 3就已經以73.32分的成績超越文心一言4.0、通義千問2.1、GLM 4、Moonshot等大模型,摘得了國內大模型排名的頭籌。
不僅如此,與國外主流大模型對比,Baichuan 4在知識百科、長文本、生成創作等文科類中文任務上明顯優于國外大模型。
「雷峰網」Baichuan 4能在短時間內取得模型能力的突破,源于其在訓練過程中引入了諸多業內領先的技術優化手段。例如,在預訓練階段采用了基于Model-based+Human-based的協同數據篩選優化方法,以及對長文本建模位置編碼科學的Scaling Law,有效提升了模型對數據的利用;在對齊階段重點優化了模型Reasoning、Planning、Instruct following能力,通過loss驅動的數據選取與訓練,多階段爬坡,多模型參數融合等方式有效提升了模型的關鍵指標和穩定性。同時突破RLHF和RLAIF融合的RLxF強化學習對齊技術,大幅提升模型的指令遵循等能力。
此外,Baichuan 4在多模態領域也取得了不錯的成績,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等評測基準上表現優異,大幅領先Gemini Pro、Claude3-sonnet等多模態模型。
同時,為了讓更多開發者、企業用戶能夠像「百小應」一樣更好的使用百川大模型的能力,百川智能推出了全新的 MaaS+AaaS 服務。
MaaS 版塊由基座模型組成,并且在綜合了成本和性能的考量下將 API 分為旗艦版和專業版。旗艦版將全量開放 Baichuan 4 的各項能力。此前,在 SuperCLUE 的金融知識百科能力上 Baichuan 3 就已取得了A+的最高評級,升級之后的 Baichuan 4 則更強。
專業版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-192K 兩款模型,在價格方面相比旗艦版 Baichuan 4 更實惠,且均針對企業用的高頻場景進行了針對性優化,綜合測試相比 GPT3.5 整體效果提升 8.9%。
百川還在 Baichuan 4 基礎上針對 Agent 構建推出 Assitant API,隨著大模型的應用在各領域持續深入,Agent 已經成為企業的關注重點。在此背景下,百川智能對模型的工具調用能力進行了特殊強化,不僅支持 Code interpreter、RAG 內建工具,還支持自定義工具調用,方便企業接入各種豐富復雜的 API。評測結果顯示其工具調用能力接近Open AI assistant API。
百川本次發布的Assitant API現已正式開啟內測邀請,感興趣的用戶均可申請免費試用。地址:https://platform.baichuan-ai.com/docs/assistants。
雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。