DeepSeek | FOCUS | DeepSeek-V3.2再革新,硬撼閉源算力躍進

02/12/2025

  OpenAI旗下閉源大模型ChatGPT迎來3歲生日之際,中國「開源之神」DeepSeek周一(1日)傍晚發布兩款新模型「贈興」--DeepSeek-V3.2及DeepSeek-V3.2-Speciale,不僅完美展示思考有多快、推理有多深,且續維持令人驚嘆的成本效益,被視作開源大模型引領AI平權的又一里程碑。

 

GPT5用戶破8億,惟接連翻車

 

  當ChatGPT的周活躍用戶突破8億,8月登場的旗艦模型GPT‑5卻接連翻車,包括將簡單方程「5.9 = X + 5.11」解作「X=-0.21」,把俄勒岡州(Oregon)標為「Onegon」……引發僅是GPT-4o「換皮」、實則毫無突破的猜疑。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

8月登場的旗艦模型GPT‑5接連翻車。

 

 

  不過,剛橫空出世的DeepSeek-V3.2,不僅正確解答「猴子有666根香蕉,每次最多背66根香蕉,可是猴子每走1米就要吃1根香蕉,問猴子最多能走多遠?」這樣的經典「燒腦」題,更問鼎全球首個斬獲2025年「頂尖四賽(國際奧數、中國奧數、國際大學生設計總決賽、國際信息學奧林匹克)」金牌的大模型。

 

「稀疏注意力」機制提升效率

 

  能答題或許不算特殊本領,畢竟谷歌旗下Gemini 3亦擅長跑分/屠榜,並獲數學家陶哲軒認證,以10分鐘解決百年數學難題(Erdosproblem/367)。今次V3.2的最大突破,當屬引入「DeepSeek 稀疏注意力(DSA)」機制,大幅提升處理長上下文的效率。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek稀疏注意力(DSA)在MLA架構下的工作流程。

 

  例如,試想像DSA是位圖書館館長,當讀者提出「通俗解釋量子糾纏」的查詢,其既不會讀完圖書館裏每一本書的每一頁,來搜尋「量子糾纏」這個關鍵詞,也不會死板地徑直前往擺放物理學分類的書架,而是融會貫通精選科學、人文、歷史等適配書籍,並深度處理如何「通俗」解釋。

 

  此得益於V3.2配置的「閃電索引器(lightning indexer)」微型神經網絡,以及「細粒度選擇機制(fine-grained token selection mechanism)」,既大幅降低計算量,亦保持高準確率。

 

想得更深,成本僅為對手零頭

 

  除了V3.2又快、又好、又省,同日推出的V3.2-Speciale更旨在探究延伸思考的潛力,在強化學習中移除長度懲罰(length penalty),並整合早前DeepSeekMath-V2的數據集和獎勵機制,允許猜想、試錯、修正、自我驗證,相當於模拟人類探索式的深度推理。此正正是其在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro的原因,惟世界級編程競賽等推理任務仍略輸於Gemini-3。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek-V3.2-Speciale在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro。

 

  按每百萬Token輸出計,GPT-5需10美元,而DeepSeek-V3.2及V3.2-Speciale僅為0.42美元,相當於前者的零頭,再次印證中國開源大模型能憑藉獨特架構和訓練範式,超越西方閉源大模型單純的算力、參數軍備競賽。

 

  值得一提的是,DeepSeek僅將今次版本命名為V3.2(V3、V3.1分別為去年12月、今年8月發布),或意味就挑戰閉源模型的複雜任務(DeepSeek坦言,過去數個月,閉源模型和開源模型之間的效能差距正在擴大),V4將成扭轉戰局的關鍵一役,且拭目以待。

撰文:金子安

【你點睇?】美國擬向歐洲八國加徵關稅,直至成功購買格陵蘭,歐洲領袖表明不可接受。你認為美國此舉會否導致美歐關係破裂? ► 立即投票

延伸閱讀

緊貼市況
  • 08637 元續科技
  • 2.330
  • 00300 美的集團
  • 87.450
  • 00917 趣致集團
  • 31.880
  • 00081 中國海外宏洋集團
  • 2.150
  • 00700 騰訊控股
  • 601.000
  • 00728 中國電信
  • 5.180
  • 目標︰$5.70
  • 09699 順豐同城
  • 11.910
  • 目標︰--
  • 01038 長江基建集團
  • 59.950
  • 目標︰$70.00
  • 00921 海信家電
  • 24.540
  • 目標︰$27.00
  • 00027 銀河娛樂
  • 40.160
  • 目標︰$43.90
  • 00981 中芯國際
  • 74.800
  • 09988 阿里巴巴-W
  • 160.000
  • 09992 泡泡瑪特
  • 196.100
  • 00700 騰訊控股
  • 601.000
  • 01810 小米集團-W
  • 35.940
  • 06680 金力永磁
  • 22.000
  • 目標︰$29.00
  • 09858 優然牧業
  • 4.250
  • 目標︰$5.20
  • 02423 貝殼-W
  • 47.540
  • 目標︰$53.00
  • SaaS More
  • 02013 微盟集團
  • 2.380
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 20/01/2026 13:02
中國指數之報價為即時更新,資料更新時間為 20/01/2026 13:02
期指之報價為即時更新,資料更新時間為 20/01/2026 13:02
緊貼市況之報價延遲最少15分鐘,資料更新時間為 20/01/2026 12:45
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

關稅戰

貨幣攻略

大國博弈

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康