語音識別上難度 訊飛輸入法免切換識別多語種多方言不迷糊!
近日,科大訊飛在北京發布訊飛星火大模型V4.0及相關落地應用。訊飛星火V4.0七大核心能力全面提升,整體超越GPT-4 Turbo,在8個國際主流測試集中排名第一,國內大模型全面領先。同時,本次星火語音大模型再升級,發布國際領先的多語種多方言免切換語音識別能力。訊飛輸入法現場演示了方言外語免切換語音輸入,大大提升用戶的輸入效率。
劉慶峰認為,語音將成為萬物互聯時代人機交互的主要方式,人機交互最重要的場景是遠場、噪聲、多人說話、多語言,因此萬物互聯時代的AIUI(人工智能用戶界面)要滿足遠場高噪聲、多語言多方言、全雙工、多模態等標準。科大訊飛也主導制定了全雙工語音交互ISO/IEC國際標準,并于2023年5月發布。
在訊飛星火4.0發布之際,星火語音大模型升級發布國際領先的多語種多方言免切換語音識別能力,可支持37個語種、37種方言“自由對話”。其中,37個語種識別效果領先OpenAI whisper-V3,37個方言識別效果平均提升30%。發布會現場,工作人員演示了訊飛輸入法免切換識別模式下多種方言和多種外語的語音輸入,讓輸入效率大大提高。
作為中文語音輸入的開創者,訊飛輸入法通過語音的持續迭代,不斷革新人機交互方式,從單一的普通話到方言,從方言免切換再發展到多語種多方言免切換,旨在滿足不斷發展變化的用戶需求。進入大模型時代,輸入法與大模型的能力深度耦合,表現出超乎想象的智能化和個性化。可以期待,未來的語音識別不僅能聽懂我們的語言,更能感受我們的情緒,甚至預測我們的需求。