黃仁勳:推理成本將繼續下降,DIGITS潛力巨大
在CES 2025主題演講中,英偉達大秀了一系列AI新品。
CES是消費電子主場,此次英偉達也是以消費級顯卡GeForce RTX 50系列打頭陣,同時公佈了巨型芯片Grace Blackwell NVLink72、小型超級計算機Project DIGITS、世界基礎模型平臺Cosmos等。
雖然是消費端產品居多,但是技術新詞也不少。美西時間1月7日,CES開幕當天,黃仁勳接受了21世紀經濟報道等媒體的採訪,對前一日發佈的新品進一步解讀,也談到了AI的新趨勢。
當黃仁勳踏進採訪間,他率先拿起的是Project DIGITS,愛不釋手地說這很“cute”,並表示大家可以使用這臺AI超級計算機。
採訪中,黃仁勳也對DIGITS再釋義,DIGITS是“deep learning GPU intelligence training system”(深度學習GPU智能訓練系統)的縮寫。他坦言這款產品更適合科學家、開發者等使用,但是他認爲DIGITS潛力巨大,因爲“人工智能可以開啓一個新篇章,它把世界上的計算機拋在後面”。
有意思的是,縱觀英偉達過去的發展歷史,其實他最早就是希望作爲一家to C的公司,比如之前做遊戲主機。但現實卻相反,他選擇了做算力的提供方。現在,通過DIGITS這樣的“電腦主機”,又開拓了偏C端的AI PC路徑。
另一方面,隨着AI應用不斷涌現,推理成本也成爲關注焦點。黃仁勳談道,英偉達通過不斷提升硬件性能(如Blackwell GPU系列)和優化計算架構,大幅提高AI推理性能並降低成本。例如,新一代GPU的推理性能較上一代提升30到40倍,從而顯著降低了數據中心的運行成本。此外,隨着算力增強,訓練和推理中的數據和模型精度不斷提高,也推動了整個行業的發展。
此外,黃仁勳一如既往地看好機器人、自動駕駛,他認爲未來幾乎所有的車都會具備自動駕駛能力。同時黃仁勳對智能眼鏡和AI技術的結合表示感到興奮,這種設備可以通過雲端的Cosmos模型支持,將複雜AI能力壓縮爲小型模型,用於實時分析和交互。
迎接AI時代
記者:雖然英偉達發佈了AI PC相關產品,但是今年相關產品銷量並未大幅增長,英偉達是否有能力改變這一現狀?
黃仁勳:AI的開發最早是在雲端完成的。過去幾年裡,英偉達的增長主要來自雲端,雲端AI已經變得非常強大,尤其是在處理複雜的大型模型時。例如,這些模型非常龐大,適合在數據中心運行和部署。
然而,我們仍然認爲,有許多設計師、軟件工程師、創作者和AI愛好者更喜歡在個人電腦上工作。問題在於,目前AI的大部分開發都需要在雲端進行,涉及大量的數據傳輸和計算,而這對很多人來說並不方便。
幸運的是,Windows系統中的WSL 2(Windows Subsystem for Linux)提供瞭解決方案。這是一個虛擬化環境,可以在Windows上運行第二操作系統,並支持Docker容器。通過確保AI技術能夠在PC上的WSL 2環境中運行,我們可以將雲端的計算能力帶到個人電腦上。
我們正在努力推動這一轉變,我認爲這就是正確的解決方案,我感到非常興奮,開發者們能夠利用Windows加上WSL 2在本地運行AI模型。
記者:發佈會宣佈了諸多進展,對於那些可能對AI缺乏瞭解的聽衆來說,你是否能用更簡單的方式解釋這些概念?
黃仁勳:作爲一家科技公司,我們技術在影響並推動未來的消費者電子領域發展。昨天一個重要的宣佈內容是,我們推出了一個名爲“Cosmos”的基礎模型。正如GPT專注於語言的基礎模型、Stable Diffusion專注於圖像,Cosmos是一種能夠理解物理世界的模型。
它可以理解摩擦力、慣性、物體存在感以及幾何和空間關係等物理屬性。這些是兒童都能理解的物理現象,但當前的語言模型卻無法處理。我們相信需要一個能理解這個物理世界的基礎模型。
一旦Cosmos建立起來,它就能像GPT和Stable Diffusion那樣支持許多應用。例如,您可以對Cosmos模型說,“告訴我這個房間裡現在的情況”,它可以基於攝像頭看到的信息回答你。
總之,Cosmos是一個理解物理世界的模型。它的意義在於,只有讓AI理解物理環境,AI才能在現實世界中做出有意義的操作。自動駕駛汽車需要理解物理世界,機器人也需要理解物理世界。因此,Cosmos這樣的模型是實現多模態的起點。
就像GPT模型推動了人工智能應用的發展,Llama對於人工智能的各種活動至關重要,而Stable Diffusion則激發了圖像和視頻生成模型的發展一樣,我們期望Cosmos能夠成爲推動下一波人工智能創新的關鍵。
解決成本難題
記者:你提到了scaling law,特別是測試時間計算方面。但是計算成本變得非常昂貴,有些運行需要耗費數千美元。英偉達如何應對這些高昂的成本?是否有解決方案可以讓推理計算更具成本效益?
黃仁勳:解決推理計算性能和成本問題的直接方法是提升我們的計算能力。這也是爲什麼我們推出了Blackwell GPU NVL 72,其推理性能相比Hopper提升了30到40倍。通過這種提升,我們將推理計算的單位成本降低了同等幅度,因爲數據中心的其他開銷基本保持不變。
從歷史上看,計算技術的進步一直依賴於降低計算成本。過去20年,我們將邊際計算成本降低了約100萬倍,使得像機器學習這樣的技術成爲可能。同樣的趨勢也會發生在推理階段:通過不斷提升性能,推理成本將會繼續下降。
此外,我們還有一種方式。今天,許多測試時間計算階段的輸出會變成預訓練、後訓練模型的輸入數據。這些數據會被用於後續的模型改進,這種方法不僅降低了訓練和推理的綜合成本,還能讓模型變得更加智能。當然,這一過程需要時間。因此,這三種scaling law將會並存一段時間。
一方面,我們會努力提升所有模型的智能水平,另一方面,人們會不斷提出更加複雜的問題,並期待得到更加智能的回答,這個循環將會持續不斷地進行下去。
記者:我們注意到英偉達最新的旗艦顯卡RTX 5090和RTX 5080之間存在較大的性能差距。5090的核心數量是5080的兩倍,而價格也高出一倍。爲什麼會設計出這樣大的差距?
黃仁勳:原因很簡單,總有一些用戶想要“最好的”。如果我們提供稍差一點、便宜100美元的產品,他們也不在乎。對於他們來說,最重要的是品質。當然,2000美元的花費不算小,但其價值是值得的。
但請記住,這些技術通常被用於家庭影院級的環境。這些用戶往往已經在顯示器和音響系統上投入了上萬美元,因此他們也希望配備最好的GPU。我們的很多客戶都有這樣的需求,他們願意爲了獲得頂尖性能而投資更多。
拓展智能產品業務範圍
記者:你提到了Agent AI,像AWS、微軟、Salesforce這樣的公司,這些公司也有平臺,你們是如何合作的?
黃仁勳:我們不是一家虛擬企業公司,而是一個科技平臺公司。我們將構建工具包、庫和模型。我們關注ServiceNow、SAP、Oracle、Synopsys、Cadence和西門子等公司,他們在垂直領域很專業,但他們並不希望將精力投入到計算層和AI庫的開發上。因此,我們爲他們提供了這一解決方案。
我們開發了NIM和NEMO技術,如果我們的CSP(雲服務提供商)希望使用它們——實際上許多CSP已經在使用了——他們可以用來訓練他們的語言模型。我們爲行業創造了這些庫,這樣他們就不需要自己去做,不需要重複構建這些東西了。
記者:自動駕駛領域,與2017年相比,2025年行業有什麼區別?2017年遇到的問題是什麼?而2021年的技術創新是什麼?
黃仁勳:首先,未來所有的移動設備都會實現自動化。在未來,大多數汽車你仍然可以選擇駕駛,但所有的汽車都有能力自動駕駛。
5年前,這項技術是否能強大並不確定,但現在技術,傳感器技術、計算機技術和軟件技術已經非常成熟。我認爲現在有太多證據表明,新一代汽車,尤其是電動汽車,幾乎每一輛都承諾具有自動駕駛能力。這些技術不再是實驗性質,而是正在廣泛落地。
特斯拉無疑是這個領域的領導者之一,但我們也看到來自中國的創新正在快速崛起。例如比亞迪、小鵬、蔚來、小米等公司展示了非常先進的技術水平。這些公司在汽車行業中設立了新的標準,證明了自動駕駛和電動車技術的潛力。
我認爲世界已經發生了變化。雖然技術成熟的過程花費了一些時間,我們的認知也在不斷髮展,但現在我認爲,自動駕駛的未來已經非常接近現實。
來源:21世紀經濟報道