通過(guò)聲網(wǎng)對(duì)話式 AI 引擎,我15分鐘讓 DeepSeek 開(kāi)口說(shuō)話
近期,DeepSeek 旋風(fēng)席卷全球,其獨(dú)有的深度思考+聯(lián)網(wǎng)模式讓用戶(hù)紛紛驚嘆好用,如果你想脫離與 AI 的文字互動(dòng),與 DeepSeek 進(jìn)行更具真實(shí)感的語(yǔ)音對(duì)話,聲網(wǎng)的對(duì)話式 AI 引擎讓你15分鐘內(nèi)就能做到。
今天,聲網(wǎng)對(duì)話式 AI 引擎 Beta 版也正式上線,支持開(kāi)發(fā)者在 Console 后臺(tái)自行開(kāi)通服務(wù)接入 API,并在 Playground 中實(shí)際調(diào)參、測(cè)試并生成代碼,僅需2行代碼,15分鐘即可部署基于大模型的對(duì)話式 AI Agent。
聲網(wǎng)對(duì)話式 AI 引擎官網(wǎng)也已同步上線,開(kāi)發(fā)者在了解產(chǎn)品功能的同時(shí),也可通過(guò)官網(wǎng)申請(qǐng)?bào)w驗(yàn)最新的 Demo 應(yīng)用。
5大能力讓你的大模型能說(shuō)會(huì)道
1、 AI 語(yǔ)音秒回 : AI 秒回你的提問(wèn),語(yǔ)音對(duì)話延遲低至650ms。
2、 對(duì)話人聲鎖定 : 屏蔽95%環(huán)境人聲、噪聲干擾,精準(zhǔn)識(shí)別對(duì)話人聲。
3、 智能打斷 : 模擬真人對(duì)話節(jié)奏,隨時(shí)打斷與 AI 的對(duì)話,響應(yīng)低至340ms。
4、 全模型適配 :實(shí)現(xiàn) DeepSeek、ChatGPT等全模型適配,更有音視頻 SDK 支持30000+終端機(jī)型適配,解決多設(shè)備兼容性的后顧之憂。
5、 不懼弱網(wǎng): 地鐵、地下車(chē)庫(kù)等弱網(wǎng)環(huán)境下,人與 AI 也能流暢對(duì)話。
聲網(wǎng)對(duì)話式 AI 引擎 將為開(kāi)發(fā)者帶來(lái)極致的對(duì)話體驗(yàn)、極簡(jiǎn)的開(kāi)發(fā)部署, 即使像 ? DeepSeek ? 這樣的文本大模型也能快速轉(zhuǎn)變?yōu)閷?duì)話式多模態(tài)大模型,具備能說(shuō)會(huì)道的能力 。同時(shí),對(duì)話式 AI引擎同樣支持基于阿里云、騰訊云的穩(wěn)定滿血版 DeepSeek ,不用擔(dān)心出現(xiàn)“服務(wù)器繁忙,請(qǐng)稍后再試”。
如何快速部署對(duì)話式 ? AI? 引擎
開(kāi)發(fā)者想要快速調(diào)用聲網(wǎng)對(duì)話式 AI 引擎 RESTful API 實(shí)現(xiàn)與 AI 語(yǔ)音互動(dòng),根據(jù)以下流程就可通過(guò)2行代碼,15分鐘快速實(shí)現(xiàn)從打開(kāi) Console 后臺(tái)到說(shuō)『Hello Agent』,大幅降低開(kāi)發(fā)門(mén)檻。
前提條件:
1、已在聲網(wǎng) Console 控制臺(tái)開(kāi)通服務(wù),并獲得 App ID、臨時(shí) Token、客戶(hù) ID 和客戶(hù)密鑰等信息。
2、已聯(lián)系聲網(wǎng)技術(shù)支持為你的項(xiàng)目開(kāi)通聲網(wǎng)對(duì)話式 AI 引擎。
3、你的 App 已實(shí)現(xiàn)基本的實(shí)時(shí)音視頻功能。
4、已獲取大模型提供商的 API key 和回調(diào) URL。
5、已獲取文本轉(zhuǎn)語(yǔ)音 (TTS) 提供商的 API key。
滿足以上前提條件,就可實(shí)現(xiàn)與 Agent 的語(yǔ)音互動(dòng)。具體流程如下圖所示:
總體來(lái)說(shuō)部署流程分為三個(gè)核心步驟: 第一步:加入 RTC 頻道 ,在你的 App 中調(diào)用『 joinChannel 』加入一個(gè) RTC 頻道。
第二步:創(chuàng)建對(duì)話式智能體 :調(diào)用『 創(chuàng)建對(duì)話式智能體』創(chuàng)建一個(gè)智能體實(shí)例,并傳入上一步中使用的頻道名和 Token 讓智能體加入同一個(gè) RTC 頻道。完成該步驟后,聲網(wǎng)會(huì)推薦你前往“控制臺(tái) - 對(duì)話式 AI 引擎 - Playground”快速體驗(yàn)與 AI 對(duì)話,正確配置各項(xiàng)參數(shù)并完成體驗(yàn)后,點(diǎn)擊右上角的 View code 復(fù)制自動(dòng)生成的服務(wù)端 API 調(diào)用示例代碼。
第三步:停止對(duì)話式智能體 :結(jié)束對(duì)話后,調(diào)用『停止對(duì)話式智能體』,讓智能體離開(kāi) RTC 頻道。
更多具體的詳細(xì)部署流程可查看聲網(wǎng)官網(wǎng)的文檔中心。
此外,聲網(wǎng)對(duì)話式 AI 引擎 在 Beta 測(cè)試階段限時(shí)免費(fèi),歡迎各行各業(yè)的開(kāi)發(fā)者參與部署并與我們交流。同時(shí),也可通過(guò)聲網(wǎng)官網(wǎng)或在聲網(wǎng)公眾號(hào)找到這篇文章,掃描文章底部的二維碼,申請(qǐng)?bào)w驗(yàn)聲網(wǎng)對(duì)話式 AI 引擎最新的 Demo 應(yīng)用。