☰

Inflection AI 爲何棄英偉達 GPU 選英特爾 Gaudi 3

在打破常規的趨勢消息裡，Inflection AI 透露其最新的企業平臺將放棄英偉達 GPU 而採用英特爾的 Gaudi 3 加速器。...

“雖然 Inflection AI 的 Pi 客戶應用此前在英偉達 GPU 上運行，但 Inflection 3.0 將由 Gaudi 3 提供支持，實例在本地或由[Tiber] AI 雲來提供支持，”英特爾表示。

Inflection AI 於 2022 年起步，是一家開發名爲 Pi 的對話式個人助理的模型構建企業。然而，今年春天，關鍵創始人穆斯塔法·蘇萊曼（Mustafa Suleyman）和卡倫·西蒙尼安（Karén Simonyan）離職前往微軟後，這家初創公司已將重點轉向爲企業使用其數據構建定製的微調模型。

這家初創公司平臺的最新版本 - Inflection 3.0 - 旨在使用其自己的專有數據集對其模型進行微調，目標是構建整個企業特定的 AI 應用程序。英特爾本身將是首批採用該服務的客戶之一，這着實讓我們懷疑 Inflection 有沒有爲加速器付全價。

雖然 Inflection 將在 Gaudi 3 加速器上運行該服務，但它似乎短期內不會搭建系統。與託管在 Azure 中的 Inflection 2.5 類似，最新版本將在英特爾的 Tiber AI 雲服務上運行。

不過，該公司確實覺得需要物理基礎設施，至少對於那些更願意將數據保留在本地的客戶來說是這樣。自 2025 年第一季度起，Inflection 計劃提供基於英特爾 AI 加速器的物理系統。

我們要指出的是，僅僅因爲這家 AI 初創公司藉助 Gaudi 3 加速器爲其企業平臺提供支持，並不意味着客戶在運行其完成的模型時就只能使用它們。

人工智能模型和軟件的開發成本可不低，和英偉達的 H100 一比，英特爾的 Gaudi 3 就相對實惠些。“通過在英特爾上運行 Inflection 3.0，我們發現價格性能提升了多達兩倍……與當前的競爭產品相比，”Inflection AI 首席執行官肖恩·懷特在週一的博客文章中寫道。

起碼從書面上來看，Gaudi 3 不但有希望在訓練和推理方面比英偉達大名鼎鼎的 H100 更快，而且價格還更低。

在 4 月的英特爾願景大會上有消息稱，Habana Lab 的 Gaudi 3 加速器具備 128GB 的 HBM2e 內存，帶寬高達 3.7Tbps，密集 FP8 或 BF16 性能達 1835 萬億次浮點運算。

在 8 位精度下，它大致和 H100 旗鼓相當

但在 16 位精度下，它所提供的密集浮點性能近乎是 H100 的兩倍，這對 Inflection 所瞄準的訓練和微調工作負載有着重大影響

英特爾在人工智能領域處於劣勢地位，而且該芯片主流供應的時機不太好，恰值英偉達的 Blackwell 和 AMD 288GB MI325X GPU 推出之時，這兩款產品都將在第四季度上市，所以，英特爾對其加速器的定價相當激進。

在今年春季的臺北國際電腦展上，英特爾首席執行官帕特·格爾辛格宣稱，一個配備了八個加速器的單個 Gaudi 3 系統僅需 12.5 萬美元，大約是同等 H100 系統的三分之二。

在最近的記憶中，轉折並非英特爾近來取得的唯一佳績。8 月，藍色巨人（IBM）宣佈將在 IBM 雲中部署英特爾的 Gaudi 3 加速器，預計在 2025 年初上線。

往後看，IBM 計劃將對 Gaudi 3 的支持擴展到其 watsonx AI 平臺。與此同時，英特爾告訴 El Reg，該加速器已向包括戴爾技術和超微在內的原始設備製造商交付。

雖然讓主要的原始設備製造商認真對待 Gaudi 對英特爾來說是一場勝利，但這個平臺的未來充滿變數。正如我們之前報道的那樣，Gaudi 3 是 Habana-Labs 開發的加速器最後的奮力一搏。

從明年起，Gaudi 會被一款叫做 Falcon Shores 的 GPU 所取代，它會將英特爾的 Xe 圖形 DNA 和 Habana 的技術相融合，這引發了有關遷移路徑的合理疑問。

英特爾一直宣稱，對於在諸如 PyTorch 這類高級框架中進行編碼的客戶而言，遷移將基本無縫。對於那些在較低級別構建 AI 應用程序的客戶，這家芯片製造商已承諾在 Falcon Shores 首次登場之前提供額外的指導方針。 ®

Inflection AI 爲何棄英偉達 GPU 選英特爾 Gaudi 3

相關資訊