中國報告大廳網訊,在近日舉行的 GTC 2026 主題演講上,英偉達正式推出了名為英偉達 Groq 3 LPU 的全新晶片。這一核心產品是英偉達新架構的重要組成部分,旨在通過高性能的推理加速能力,滿足日益增長的計算需求。伴隨該晶片亮相的是完整的 Vera Rubin 平台發布,該平台整合了多款創新硬體,標誌著 AI 基礎設施向更低延遲與更大吞吐量的方向邁出了關鍵一步。

中國報告大廳發布的《2026-2031年中國機櫃行業市場分析及發展前景預測報告》指出,英偉達推出的 Vera Rubin 平台包含七款晶片,具體涵蓋 Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX-9 超級網卡、BlueField-4 DPU 以及 Spectrum-6 乙太網交換機。在 Groq 3 LPX 機架中,將構建包含 256 個 LPU 的配置,每個 LPU 集成 500MB 的 SRAM,總計提供 128GB SRAM,實現 40 PB/s 的推理加速帶寬。通過每個機架 640 TB/s 的專用擴展接口,這些晶片將被高效連接起來。該架構與 Vera Rubin NVL72、Vera CPU 等另外四款機架共同構成完整的 AI 超級計算機平台。Groq 3 LPX 定位為 Vera Rubin 的推理加速器,旨在滿足智能體系統對低延遲和大上下文的需求。
Groq 3 LPU 晶片將由三星代工生產。LPU 與 Vera Rubin 平台結合後,通過協同設計的架構將 Rubin GPU 和 LPU 的卓越性能完美結合,推理吞吐量/功耗比提升幅度將達到 35 倍。預計新架構機櫃將於今年下半年開始出貨,具體量產時間定於今年第四季度。市場數據顯示,Groq 3 LPX 是 Vera Rubin 的推理加速器,具備更低的延遲和更大的上下文處理能力。英偉達表示,LPU 與 Vera Rubin 平台的協同設計使其呈現極低延遲與超大吞吐量的特點,顯著增強了 AI 智能體系統的響應速度。
分析師指出,在英偉達投資 Groq 之後,LPU 的出貨量預測已大幅上調。預計 2026 至 2027 年的總出貨量將達到 400 萬至 500 萬顆。其中 2026 年與 2027 年機櫃出貨量分別約為 300 至 500 個,以及 15000 至 20000 個。LPU 需求增長主要來自外部因素,一方面與英偉達生態系(如 CUDA)高度整合,大幅降低應用開發與部署門檻;另一方面,業內超低延遲推理需求快速增加,包括 AI 智能體、即時處理、終端用戶與物理 AI 等類型應用。目前 Tokens 的消耗量大幅增長,帶動推理晶片市場規模的高增長。LPU 有望在推理晶片市場中逐步滲透,具有高成長性的市場空間。基於大模型推理過程中存在延遲,主要瓶頸在於內存帶寬,而 LPU 具備更快的內存帶寬,可縮短大模型推理過程中的延遲,提供更具性價比的價格。相關 PCB 機會建議關註:智微智能(參股元川微)、星宸科技(多輪增資元川微)、滬電股份、勝宏科技、深南電路。
綜上所述,英偉達通過發布 Vera Rubin 平台及 Groq 3 LPU,確立了在 AI 推理領域的領先地位。該平台憑藉極高的帶寬和優化的架構設計,顯著提升了吞吐量與功耗比,並明確規劃了 2026 至 2027 年的大規模量產路徑。隨著智能體及物理 AI 應用的爆發,Groq 3 LPU 將在降低延遲、提升效率方面發揮關鍵作用,同時為產業鏈上下游帶來顯著的市場機遇,推動行業向感知智能與生成智能之後的高級階段邁進。
更多機櫃行業研究分析,詳見中國報告大廳《機櫃行業報告匯總》。這裡匯聚海量專業資料,深度剖析各行業發展態勢與趨勢,為您的決策提供堅實依據。
更多詳細的行業數據盡在【資料庫】,涵蓋了宏觀數據、產量數據、進出口數據、價格數據及上市公司財務數據等各類型數據內容。
摩根史坦利報告指出,GB200 NVL72機架在三大ODM(鴻海、廣達、緯創)的總出貨量從6月的約2500台下降至7月的約2000台。此次出貨量下滑的主要驅動因素之一是緯創正在進行的產能調整。具體而言,緯創正在將其計算托盤(L10)的生產線從中國台灣轉移到墨西哥。
中國報告大廳聲明:本平台發布的資訊內容主要來源於合作媒體及專業機構,信息旨在為投資者提供一個參考視角,幫助投資者更好地了解市場動態和行業趨勢,並不構成任何形式的投資建議或指導,任何基於本平台資訊的投資行為,由投資者自行承擔相應的風險和後果。
我們友情提示投資者:市場有風險,投資需謹慎。