產業分析-鞏固AI晶片龍頭… 輝達的優勢與挑戰
AI晶片龍頭輝達在其最主要客戶的大型雲端服務業者致力開發ASIC加速晶片,建置自有AI伺服器基礎設施,在中長期上將成爲輝達AI發展的潛在競爭對手。圖/路透
AI晶片龍頭輝達在其最主要客戶的大型雲端服務業者致力開發ASIC加速晶片,建置自有AI伺服器基礎設施,在中長期上將成爲輝達AI發展的潛在競爭對手。圖/ 美聯社
NVIDIA將往外拓展更多元完整的AI解決方案
NVIDIA積極建構自有AI與HPC伺服器整造解決方案
人工智慧(AI)晶片龍頭 輝達(NVIDIA)高營收成長動力來自資料中心AI伺服器相關解決方案業務,未來將進一步整合軟硬體資源,並將其高階和中低階GPU AI加速晶片,與各ODMs/OEMs綁定合作軟硬體系統認證模式。不過,現爲最主要AI客戶的大型雲端服務業者也致力開發ASIC加速晶片,建置自有AI伺服器基礎設施,在中長期上將成爲輝達AI發展的潛在競爭對手。
■積極拓展AI伺服器軟硬整合方案
在AI伺服器高度發展態勢下,身爲市場領頭羊的輝達除了發展自家DGX等AI伺服器整機方案外,另外積極推動英業達、廣達、工業富聯等ODMs,或如戴爾、HPE、Supermicro等OEMs,依其發佈的HGX或MGXAI伺服器參考設計,得通過輝達的相關AI軟硬體認證過程。輝達藉此整合各種晶片如Arm CPU、GPU與NPU等,提供更彈性與更多元軟硬體解決方案。
輝達近年在AI裡領域已漸從GPU領先基礎,跨至Arm CPU、伺服器周邊DPU晶片開發,以及高度整合的AI/HPC伺服器DGX,進一步踏入伺服器系統雲端整合商,例如DGX AI Foundations服務等,促使輝達經營商業模式變化,從以往一次性AI硬體收入方式,進一步發展成更彈性或符合長期發展考量的雲端訂閱模式。
隨着ChatBOT應用蓬勃發展,AI伺服器組態從一臺搭載4~8張A100和H100,於2023下半年逐步擴展至各專業領域開發市場,使每臺搭配2~4張GPU等型態的AI伺服器需求漸增,在高單價ASP下,成爲帶動輝達營收成長的主要來源。
TrendForce預期,邊緣AI伺服器未來成長主要關鍵,對較小規模的廠商來說,對各應用領域較小型的LLM模型,可用輝達相較訴求高C/P值、低價的L40S或L4等去主攻此市場。此外,輝達也考量DGX等整合型AI伺服器,雖性能高但價格也昂貴,未來可利用具彈性的租賃服務方式,降低各AI應用領域如電商、金融、製造、醫療、交通等進入AI領域門檻。
■ODM與OEM業者可望跟隨輝達成長
預期隨着雲端和邊緣各種AI伺服器應用服務發展,也將帶動相關AI供應鏈發展,尤其2023年雲端AI伺服器以搭載輝達高階GPU如A100、H100爲大宗。在高階AI伺服器方面,又以輝達提出參考設計,以二顆CPU搭配八顆高階A100或H100的DGX AI伺服器或HGX AI伺服器參考架構爲主流。其中,DGX和HGX主要差別在DGX主打輝達自有品牌的AI伺服器解決方案,HGX則由輝達提供參考設計版,ODM/OEM可依終端客戶需求設計自有AI伺服器方案。
以DGX或HGX H100爲例,在搭載多顆GPU下,尤其對整體AI伺服器的高速網通互連能力,或散熱系統設計上將有較嚴苛需求,估其至少爲傳統常見2路伺服器耗能約3~4倍以上,多家該類AI伺服器系統設計多逾10kW。
故隨着AI伺服器高度成長,除了將帶起伺服器ODMs或OEMs如緯創、工業富聯、英業達、廣達、緯穎、Supermicro、技嘉、戴爾等成長趨勢外,也將帶動其他AI伺服器供應鏈如高速網通裝置、散熱和冷卻系統、電源管理IC或其他網通及I/O等廠商的成長動能。
■大型CSP客戶自研開發,未來恐成對手
微軟在ChatGPT AI應用熱潮下,2023年整合旗下Bing、Office發展Copilot,積極採購雲端AI伺服器。而Google、AWS等除了輝達GPU外,也將同步擴大導入搭載自研ASIC AI晶片基礎設施,帶動AI伺服器2023年出貨成長近35%,比一般運算、儲存伺服器具顯著較佳成長動能。同時,各產業如金融、商務、雲端、車用等服務陸續導入生成式AI技術發展,預期2024年後AI伺服器市場將更明顯分爲兩大陣營:
一、採外購GPU如輝達、超微(AMD)等AI加速晶片;二、雲端廠商自研晶片如Google、AWS推自研ASIC AI加速晶片。
其中,由雲端廠商自主研發的AISC晶片,2023年在Google欲與微軟競逐AI搜尋引擎平臺和各種衍生服務應用下,下半年尤爲積極擴大自研TPU晶片導入AI伺服器基礎設施,推升整體ASIC AI伺服器佔整體比例將逾24%,預估AWS 2024年後也將針對AI訓練和AI推論應用,更投入拓展ASIC AI加速晶片發展,將成爲GPU外重要成長動能,其他相繼投入者還有微軟、Meta乃至特斯拉(Tesla)等,也可能成爲輝達業務拓展上潛在威脅。