DeepSeek在2026年元旦假期發布技術論文,提出名為「流形約束超連接」(mHC)訓練框架,解決大型語言模型訓練過程不穩定問題。由創始人梁文鋒參與撰寫的論文迅速引發業界關注,多家國際科技媒體稱為「突破性進展」。
論文發布的時機引發外界揣測。DeepSeek過往在R1模型發布前曾公開基礎訓練研究,分析師認為mHC技術將成為下一代旗艦模型核心架構。社交媒體消息,DeepSeek V4預計2月17日農曆新年假期間推出,與去年DeepSeek R1發布節奏相符。
AI板塊見升勢,當虹科技(滬:688039)、天下秀(滬:600556)、岩山科技(深:002195)及利歐股份(深:002131)漲停,中科信息(深:300678)升17.5%,開普云(滬:688228)飆14%,易點天下(深:301171)升9.8%。
《經濟通通訊社5日專訊》
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇
























