27/08/2025 16:31
【AI】阿里(09988)發布及開源全新語音驅動生視頻模型
阿里巴巴(09988)正式發布並開源全新Wan2.2-S2V語音驅動生視頻(Speech-to-Video)模型,專為數字人視頻創作而開發,公司稱可透過單張圖片及一段音頻,即可生成高品質的動畫視頻。其模型是阿里巴巴Wan2.2視頻生成系列的一員。用戶可在Hugging Face、GitHub以及阿里雲開源社區ModelScope下載Wan2.2-S2V。
阿里稱,Wan2.2-S2V支持肖像、半身以及全身等多種畫幅形式的視頻創作,模型可依據文本指引動態生成人物動作與場景元素,協助專業內容創作者捕捉精準的視覺表現,以滿足特定敘事與設計需求。
該技術亦支持480P、720P的解像度輸出,既適用於社交媒體內容,也適合專業展示。
阿里亦提到,另一項重要突破在於模型創新的幀處理技術,可將任意長度的歷史幀壓縮為單一且緊湊的隱層特徵,大幅降低計算消耗,並成功實現長視頻的穩定生成,從而解決長時段動畫內容製作中的關鍵挑戰。
阿里巴巴已於2025年2月開源Wan2.1系列模型,並於同年7月開源Wan2.2系列模型。至今Wan系列模型在Hugging Face與ModelScope平台的總下載量已突破690萬次。
《經濟通通訊社27日專訊》
阿里稱,Wan2.2-S2V支持肖像、半身以及全身等多種畫幅形式的視頻創作,模型可依據文本指引動態生成人物動作與場景元素,協助專業內容創作者捕捉精準的視覺表現,以滿足特定敘事與設計需求。
該技術亦支持480P、720P的解像度輸出,既適用於社交媒體內容,也適合專業展示。
阿里亦提到,另一項重要突破在於模型創新的幀處理技術,可將任意長度的歷史幀壓縮為單一且緊湊的隱層特徵,大幅降低計算消耗,並成功實現長視頻的穩定生成,從而解決長時段動畫內容製作中的關鍵挑戰。
阿里巴巴已於2025年2月開源Wan2.1系列模型,並於同年7月開源Wan2.2系列模型。至今Wan系列模型在Hugging Face與ModelScope平台的總下載量已突破690萬次。
《經濟通通訊社27日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
【北水炒D乜】淨流入近154億元,買盈富基金沽中芯 27/08/2025 17:39
-
下一篇
期指結算前夕恒指全日跌323點收報25201,美團騰訊沽壓重 27/08/2025 16:13
-
《異動股》威高股份等3家公司上午9:31異動 28/08/2025 09:32
-
《盤前攻略》中概股急跌恒指料低開,美團次季績差ADR挫近7% 28/08/2025 09:00
-
《政政經經-石鏡泉》又試25000 28/08/2025 08:10
-
A股轉弱恒指跌幅擴至300點,美團績前跌近3%,騰訊跌2% 27/08/2025 14:29
-
【阿里預測】首財季料少賺11%,外賣等業務大手補貼料蝕百億元 27/08/2025 14:21
備註︰
即時報價更新時間為 12/09/2025 17:06
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站