倫敦--(美國商業資訊)--亞洲最大的幾家雲端服務商正採取哪些措施來滿足與日俱增的AI推理需求?Omdia的最新研究深入分析了AI推理營運所面臨的不斷演變的挑戰,輸送量、延遲與支援多樣化AI模型之間的關鍵權衡,以及可能的解決方案。該報告詳細涵蓋了
華為、百度、阿里巴巴、字節跳動、騰訊、NAVER和SK Telecom Enterprise等公司,考察了這些公司所提供的GPU、AI加速器和經過AI最佳化的CPU及其定價、輝達(NVIDIA) GPU的庫存、AI服務組合,以及自有AI模型和客製化晶片專案的現狀。
儘管在2024年至2025年初美國實施出口管制前,中國企業大量囤積了輝達(NVIDIA) H800和H20 GPU,但在國內雲端服務中卻難以見到這些高效能晶片的身影,這顯示它們主要被用於頂級雲端服務商者自身的模型開發專案。同樣,採用中國本土AI晶片專案的方案也相對較少,例外情況包括百度的本地雲端產品和華為雲的部分服務,但這類應用仍十分有限。中國頂級雲端服務商者在採用「預填充與生成分離」等最佳實務方面已相當成熟,且在基礎AI領域發表了具有開創性的研究成果;然而,除少數顯著案例外,這些研究論文中常提到訓練過程使用的是西方的GPU。
Omdia首席分析師、報告作者Alexander Harrowell表示:「中國半導體領域的真正成就體現在CPU而非加速器上。中國基於Arm架構的CPU顯然已實現規模化生產,且通常像亞馬遜雲端科技服務(AWS)的Graviton系列那樣針對並行工作負載進行了最佳化。例如,阿里巴巴的倚天710等產品為企業部署目前一代小型AI模型(如阿里巴巴通義千問3)提供了經濟實惠的解決方案,適用於使用者基數相對較小、工作負載多樣性較高的場景。」
若需使用現代化的GPU,Omdia發現最具競爭力的方案是SK Telecom與Lambda Labs合作打造的「GPU即服務」產品。Omdia注意到,許多中國企業熱衷於將工作負載移轉至防火牆之外,以期取得現代化GPU和潛在的額外訓練資料。其他重要發現包括:幾乎所有公司如今都提供「模型即服務」平台,支援微調及其他客製化操作,這已成為企業掌握AI能力最常見的方式之一。中國頂級雲端服務商者對支援邊緣AI應用尤為感興趣。例如,字節跳動提供了一套預整合解決方案,可用於監控餐廳廚房並報告廚師是否佩戴了工作帽。
關於OMDIA
Omdia隸屬於Informa TechTarget, Inc.(納斯達克代碼:TTGT),是一家全球領先的技術研究與諮詢機構。依託對科技市場的深刻洞察、與行業領袖的深入對話以及龐大數據資源,Omdia幫助客戶洞察趨勢、把握機遇,搶佔市場先機。從研發到投資回報,我們識別最具潛力的機遇,推動科技產業持續發展。
免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。
請前往 businesswire.com 瀏覽源版本: https://www.businesswire.com/news/home/20250723758953/zh-HK/
CONTACT:
Fasiha Khan: fasiha.khan@omdia.com
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇