• 恒指
  • 26,534
  • +302
  •  大市成交 2,189億
  • 期指
  • 26,574
  • +333
  • 高水40
  • 國指
  • 9,184
  • +136
  • 紅籌
  • 4,103
  • +2
  • 科指
  • 5,834
  • +147
  • 上證
  • 4,160
  • +39
  •  成交 12,097億
21/10/2025 09:21

【AI】美團LongCat團隊發布並開源VitaBench大模型評測基準

  美團LongCat團隊20日正式發布當前高度貼近真實生活場景、面向複雜問題的大模型智能體評測基準--VitaBench(Versatile Interactive Tasks Benchmark),並已全面開源。

  據官方介紹,VitaBench以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景為典型載體,構建了包含66個工具的交互式評測環境,並進行了跨場景的綜合任務設計。例如,在旅遊規劃任務中,要求智能體通過思考、調用工具和用戶交互,完整執行從買好票到訂好餐廳的終端狀態。
《經濟通通訊社21日專訊》

當國家領土變成可交易商品,世界會變成點?即刻投票發表你對「購島論」的睇法。► 立即投票

備註︰

即時報價更新時間為 12/01/2026 14:07

港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站

權證
即時報價
全文搜索
Search
最近搜看
貨幣攻略
大國博弈
More
Share