• 恒指
  • 26,623
  • +495
  •  大市成交 3,091億
  • 期指(夜)
  • 26,735
  • +30
  • 高水112
  • 國指
  • 9,454
  • +151
  • 紅籌
  • 4,022
  • +26
  • 科指
  • 6,324
  • +129
  • 上證
  • 3,863
  • +34
  •  成交 9,682億
01/09/2025 09:32

【AI】美團開源大模型「龍貓」,部分性能超越DeepSeek

  美團(03690)開源大模型「龍貓」(LongCat-Flash),這是一個擁有5600億參數的混合專家(MoE)模型,據介紹,在各項基準測試中它與業界的DeepSeek V3.1、Qwen3旗鼓相當,甚至在某些特定能力上實現了超越。

  該模型創新性地採用「零計算」專家機制(Zero-computation Experts) ,能夠極大地節省算力,在處理每個詞元(token)時,僅需動態激活186億至313億的參數(平均約270億)。此外,模型的推理速度超過100詞元/秒(TPS),每處理一百萬輸出詞元的成本僅為0.7美元,並且支持128k的長文本上下文。

  目前,LongCat-Flash模型已經發布在Hugging Face和Githiub社區,並遵循MIT許可協議。
《經濟通通訊社1日專訊》

送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好

備註︰

即時報價更新時間為 29/09/2025 17:59

港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站

權證
即時報價
全文搜索
Search
最近搜看
關稅戰
大國博弈
More
Share