05/12/2025 16:57
【AI】豆包語音識別模型2.0發布,推理能力提升,支持日韓德等13種外語
火山引擎今日正式發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0)。
據介紹,該模型依托Seed混合專家大語言模型架構構建,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%;支持多模態視覺識別,在「聽得懂」的同時「看得懂」,通過單圖和多圖等視覺信息輸入提升文字識別精準度。
同時,該版本支持日語、韓語、德語、法語等13種海外語種的識別,並且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等複雜場景進行了升級。
《經濟通通訊社5日專訊》
據介紹,該模型依托Seed混合專家大語言模型架構構建,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%;支持多模態視覺識別,在「聽得懂」的同時「看得懂」,通過單圖和多圖等視覺信息輸入提升文字識別精準度。
同時,該版本支持日語、韓語、德語、法語等13種海外語種的識別,並且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等複雜場景進行了升級。
《經濟通通訊社5日專訊》
【你點睇?】入場更容易?從股票每手股數到期貨合約大小,降低入場門檻會否增加你的投資意欲?► 立即投票
-
上一篇
【AI】馬斯克考慮每年發射100萬噸AI衛星 08/12/2025 10:01
-
下一篇
【AI】韓國總統李在明會見軟銀CEO孫正義,討論AI領域合作 05/12/2025 14:27
-
【AI】智元第5000台具身機器人量產下線,已具備批量出貨能力 08/12/2025 16:59
-
【AI】達利歐看好中東AI崛起,建議投資者不要倉促退出AI泡沫 08/12/2025 16:33
-
【AI】OpenAI將提前推出GPT-5.2,迎戰谷歌Gemini 08/12/2025 11:35
-
【AI】華為任正非:AI重在應用,能使國家更強大 05/12/2025 11:51
-
【AI】惠譽料AI投資熱潮及股市暢旺,緩衝美國經濟放緩影響 05/12/2025 11:20