【FOCUS】短短48小時,AI界迎來兩大前沿模型「上新」--OpenAI旗下GPT-5.5,以及DeepsSeek-V4。「誰更聰明」見仁見智,但「誰更便宜」一目了然--以每百萬token輸出價格計,前者高達30美元,後者低至6元人民幣,可謂「魚翅VS蘿蔔」。放在內地日均token調用量突破140萬億(截至3月)的背景下,或意味北京的策略方向,已從算力追趕,變為token轉化。
*區分精讀跳讀,百萬上下文成標配*
「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。
面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。
這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」
*軟硬協同反制壟斷,利規模化落地*
值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。
有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具成本競爭力的token,無疑將推動大模型商業化落地,以及「token經濟」規模化。
此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位。
【你點睇?】白宮記協晚宴爆發槍擊案,你認為事件會否提升共和黨在中期選舉的勝算?你認為特朗普會否被國內安全問題吸引,削弱對伊朗軍事動作力度? ► 立即投票





















