螞蟻集團正式推出萬億參數思考模型Ring-1T,並全面開源模型權重、訓練配方。據悉,Ring-1T在「人類偏好對齊」測試Arena-Hard V2中,以81.59的成功率居於開源模型榜首,逼近GPT-5-Thinking(High)82.91的成績。
Ring-1T在9月30日開源的預覽版Ring-1T-preview基礎上,持續擴展大規模可驗證獎勵強化學習(RLVR)訓練,進一步激發萬億基座的自然語言推理能力,並通過RLHF訓練完善模型通用能力,在各項任務榜單上表現更加均衡。
《經濟通通訊社14日專訊》
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇