NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表6種晶片組成多種機櫃化Vera Rubin世代運算單元,並推出Space-1 Vera Rubin模組。NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表的6種運算、通訊晶片,組NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表6種晶片組成多種機櫃化Vera Rubin世代運算單元,並推出Space-1 Vera Rubin模組。NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表的6種運算、通訊晶片,組

【GTC 2026】NVIDIA Vera Rubin世代7種晶片與5種機櫃打造最強AI工廠,還要送晶片上太空

2026/03/19 15:30
閱讀時長 12 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表的6種運算、通訊晶片,組成多種機櫃化Vera Rubin世代運算單元,並計劃推出Space-1 Vera Rubin模組,將AI運算送上太空。

代理式AI推升CPU運算需求

NVIDIA 於GTC 2026大會Vera Rubin世代AI運算平台的7款新晶片已全面進入量產,其中包括筆者先前與CES 26介紹過的Vera CPU(處理器)、Rubin GPU(繪圖處理器)、ConnectX-9乙太網路、BlueField-4 DPU(資料處理器)、NVLink 6交換器、Specturm-X矽光子乙太網路等6種晶片(詳細介紹請點我),以及這次在GTC 2026發表的Groq 3 LPU(語言處理器),透過協同運作的方式組成1台強大的AI超級電腦,滿足大規模預訓練、後訓練、測試階段擴展,以及代理型AI推論運算等需求。

由於代理式AI的功能包含存取資料、規劃任務、調用工具、執行程式並驗證結果,因此除了需要透過GPU加速AI運算的部分之外,也需要大量的CPU運算資源以滿足代理式AI同時操作多款傳統架構應用程式的需求。

另一方面,為了滿足AI工廠與主權AI等超大規模的AI運算需求,NVIDIA積極推動完全整合的機櫃級系統與POD級部署,在提高效能的同時帶來更高的成本效益。

NVIDIA執行長黃仁勳於GTC 2026開幕演說中特別重申Vera CPU的設計理念包含高效能處理器運算、高速資料傳輸與交換、高電力效率等特色,是全球首款專為代理式AI與強化學習設計的處理器。

此外NVIDIA也宣布推出全新Vera CPU機櫃,整合256顆液冷式Vera CPU,可同時支援22,528組能以完整效能獨立運作的CPU執行環境,並且能夠透過 NVLink-C2C 互連技術與NVIDIA GPU通訊、高速資料共享,也能透過ConnectX網路卡與BlueField DPU整合,以加速網路、儲存與資安相關功能,對代理型AI應用至關重要。

Vera Rubin世代AI運算平台包含7款晶片與5款機櫃設計。

Vera Rubin運算托盤與NVLink交換器托盤負責主要的AI運算,以及串聯多組GPU的Scale-Up擴展。

Vera運算托盤組成以CPU運算為主的輔助運算機櫃,能協助代理式AI執行各種傳統架構程式。

BlueField-4 STX儲存伺服器提供記憶體擴展的功能。

Spectrum-X CPO交換器托盤則提供以矽光子通訊為基礎的跨機櫃或跨POD的Scale-Out擴展功能。

Groq 3 LPX運算托盤則是透過導入LPU縮短字詞生成的延遲,進一步改善整體運算效能。

在Vera Rubin系統的助力下,NVIDIA在10年間將AI運算效能推升了4億倍。

圖中左起分別為Groq 3 LPX運算托盤、NVL交換器托盤、Vera Rubin運算托盤實物。

圖中左起分別為BlueField-4 STX儲存伺服器、Vera運算托盤(由純CPU組成)、Spectrum-X CPO交換器托盤(具有矽光子通迅功能)。

黃仁勳手持晶片為採用矽光子共同封裝的Spectrum CPO晶片。

Vera Rubin運算托盤採用無纜線與水冷設計,托盤間的通訊也採用模組化的結構化纜線(structural Cable),能大幅簡化機櫃組裝,將施工時間由2天縮短至2小時。

LPU與儲存也有機櫃級方案

NVIDIA在收購Groq公司後,於GTC 2026大會發表了Groq 3 LPU,強化結合完整軟、硬體堆疊的系統在AI推論運算的效能輸出、電力效率與成本效益。Groq 3 LPX機櫃則是專為代理型系統的低延遲和大型情境需求所設計,大幅提升1T等級參數的AI推論運算吞吐量,對於資料中心的收益有著立竿見影的助益。

Groq 3 LPX機櫃採用全水冷設計,由256顆LPU構成,具有總容量達128GB的晶片內部SRAM(靜態隨機存取記憶體),傳輸頻寬高達640 TB/s,能夠以大規模部署的方式構成巨型叢集,並視為單一處理器運作,還能夠與Vera Rubin系統相互搭配,讓Rubin GPU與Groq LPU協同進行AI模型的各層運算從而提升解碼效能與增加輸出字詞(Token),以改善整體系統的運算、記憶體存取、功耗等方面的效率。(其概念可參考「Rubin CPX GPU,透過分離運算提升6倍AI推論效能」一文)

BlueField-4 STX儲存機櫃則為AI原生的儲存架構,由Vera CPU、BlueField-4 DPU、ConnectX-9網路卡驅動,能夠讓GPU無縫存取整個POD系統中的記憶體,並針對大型語言模型((Large Language Model,LLM)與代理式AI運算流程產生的大量KV Cache進行最佳化,透過改善存取效能的方式大幅提升整體效能表現。NVIDIA表示搭配DOCA Memos框架使用的情況下,能夠帶將AI推論運算的資料傳輸量提升至通用儲存架構的5倍,並明顯提升電力效率。

Groq 3是為大語言模型推論運算設計的LPU,透過頻寬高達150 TB/s的SRAM大幅提升論速度。

單一Groq 3的SRAM容量僅有500 MB,透過串接8組Groq 3能將容量擴展至4 GB,並讓等效頻寬達到1200 TB/s。

Vera Rubin與Groq 3分別負責預填寫(Prefill)、注意力解碼(Decode Attention)前饋神經網路解碼(Decode Feed Forward Network)等不同任務,加速字詞生成速度。

Groq 3 LPX機櫃由32組Groq 3 LPX運算托盤組成,能夠提供315 PFLOPS的AI推論運算效能與128 GB SRAM,以及高達40 PB/s的記憶體頻寬,對外頻寬則為640 TB/s。

Vera CPU機櫃總共具有256組Vera處理器,具有多達22,528組處理器核心。

BlueField-4 STX儲存機櫃則可改善5倍系統的字詞生成效能。

與x86處理器與600組Hopper GPU組成的系統相比,僅有300組GPU的Vera Rubin系統可以提供350倍的效能。

Vera Rubin與Groq 3 LPX組成的系統能夠將1T參數模型的電力效率最高可提升35倍,同時創造出多達10倍的收益機會。

Vera Rubin To the Moon!

Space-1 Vera Rubin模組是針對太空環境設計的加速運算平台,其CPU與GPU透過緊密整合的架構和高頻寬互連技術提供了所需效能和記憶體存取,能夠即時處理來自太空設備的龐大資料流,提供大規模的資料中心級 AI 能力,使大型語言模型和進階基礎模型得以直接在太空中運作,為軌道資料中心、先進的地理空間情報處理及自主太空營運等使用情境提供強悍且可靠的運算能力。

黃仁勳也在GTC 2026 GPU技術大會開幕演說中提到,雖然太空環境的溫度相當低,但是因為真空的關係無法透過傳導與對流方式散熱,僅能透過輻射方式排除晶片產生的廢熱是個相當大的挑戰,公司的眾多優秀工程師會努力解決這個問題。

此外NVIDIA也會將IGX Thor和Jetson Orin平台送上太空,以尺寸緊湊的模組提供高能效AI推論、圖像感知和加速資料處理能力,實現衛星軌道上的邊緣運算。

NVIDIA將推出能夠適應太空極端環境的Space-1 Vera Rubin模組。

此外還有IGX Thor和Jetson Orin等平台,也都能進入衛星軌道滿足邊緣運算的需求。

NVIDIA 創辦人暨執行長黃仁勳表示:「作為最後的前沿領域,太空運算時代已經到來。隨著我們部署衛星星座並更深入地探索太空,智慧必須存在於任何生成資料的地方。跨太空和地面系統的 AI 處理能力,能夠實現即時感知、決策制定和自主性,將軌道資料中心轉化為探索工具,並把太空飛行器轉化為自主導航系統。我們正與合作夥伴攜手,將 NVIDIA 的技術延伸到地球之外,大膽地將智慧帶到前所未及之處。」

市場機遇
4 圖標
4實時價格 (4)
$0.006565
$0.006565$0.006565
+1.20%
USD
4 (4) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡