美股動向 | 英偉達發布新一代Rubin CPX專用AI晶片,超長上下文推理專用
10/09/2025
《經濟通通訊社9日專訊》英偉達(US.NVDA)推出專為超長上下文推理設計的新型GPU——Rubin CPX,預計於2026年底正式量產並上市。
這款新產品採用模組化卡片形式,既可嵌入現有服務器架構,也可用於數據中心中與其他硬件並行運行的獨立計算節點,專注於處理視頻生成與軟件開發等高負載AI任務。
Rubin CPX作為英偉達下一代Rubin系列的衍生產品,專門針對AI推理中計算密集的上下文處理階段進行硬件分離,將原本由單一GPU同時負責理解輸入與生成回答的工作拆分為兩套GPU協同運算,大幅提升推理效率。根據英偉達介紹,Rubin CPX可實現推理運算效率高達目前旗艦機架的6.5倍,特別適合處理需一次性理解超長上下文模型。
英偉達CEO黃仁勳強調,Rubin CPX與Rubin GPU的組合將構成Vera Rubin NVL144 CPX平台,該平台整合36核心Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU,單機架推理算力可達8 ExaFLOPs,搭配超過100TB高速記憶體與1.7PB/s記憶體帶寬,將顯著提升大型AI模型的算力密度與效能表現。(kk)
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽