NVIDIA在GTC 2026 GPU技術大會發表Groq 3 LPU語言處理器,搭配先前已發表的6種運算、通訊晶片,組成多種機櫃化Vera Rubin世代運算單元,並計劃推出Space-1 Vera Rubin模組,將AI運算送上太空。
代理式AI推升CPU運算需求
NVIDIA 於GTC 2026大會Vera Rubin世代AI運算平台的7款新晶片已全面進入量產,其中包括筆者先前與CES 26介紹過的Vera CPU(處理器)、Rubin GPU(繪圖處理器)、ConnectX-9乙太網路、BlueField-4 DPU(資料處理器)、NVLink 6交換器、Specturm-X矽光子乙太網路等6種晶片(詳細介紹請點我),以及這次在GTC 2026發表的Groq 3 LPU(語言處理器),透過協同運作的方式組成1台強大的AI超級電腦,滿足大規模預訓練、後訓練、測試階段擴展,以及代理型AI推論運算等需求。
由於代理式AI的功能包含存取資料、規劃任務、調用工具、執行程式並驗證結果,因此除了需要透過GPU加速AI運算的部分之外,也需要大量的CPU運算資源以滿足代理式AI同時操作多款傳統架構應用程式的需求。
另一方面,為了滿足AI工廠與主權AI等超大規模的AI運算需求,NVIDIA積極推動完全整合的機櫃級系統與POD級部署,在提高效能的同時帶來更高的成本效益。
NVIDIA執行長黃仁勳於GTC 2026開幕演說中特別重申Vera CPU的設計理念包含高效能處理器運算、高速資料傳輸與交換、高電力效率等特色,是全球首款專為代理式AI與強化學習設計的處理器。
此外NVIDIA也宣布推出全新Vera CPU機櫃,整合256顆液冷式Vera CPU,可同時支援22,528組能以完整效能獨立運作的CPU執行環境,並且能夠透過 NVLink-C2C 互連技術與NVIDIA GPU通訊、高速資料共享,也能透過ConnectX網路卡與BlueField DPU整合,以加速網路、儲存與資安相關功能,對代理型AI應用至關重要。











LPU與儲存也有機櫃級方案
NVIDIA在收購Groq公司後,於GTC 2026大會發表了Groq 3 LPU,強化結合完整軟、硬體堆疊的系統在AI推論運算的效能輸出、電力效率與成本效益。Groq 3 LPX機櫃則是專為代理型系統的低延遲和大型情境需求所設計,大幅提升1T等級參數的AI推論運算吞吐量,對於資料中心的收益有著立竿見影的助益。
Groq 3 LPX機櫃採用全水冷設計,由256顆LPU構成,具有總容量達128GB的晶片內部SRAM(靜態隨機存取記憶體),傳輸頻寬高達640 TB/s,能夠以大規模部署的方式構成巨型叢集,並視為單一處理器運作,還能夠與Vera Rubin系統相互搭配,讓Rubin GPU與Groq LPU協同進行AI模型的各層運算從而提升解碼效能與增加輸出字詞(Token),以改善整體系統的運算、記憶體存取、功耗等方面的效率。(其概念可參考「Rubin CPX GPU,透過分離運算提升6倍AI推論效能」一文)
BlueField-4 STX儲存機櫃則為AI原生的儲存架構,由Vera CPU、BlueField-4 DPU、ConnectX-9網路卡驅動,能夠讓GPU無縫存取整個POD系統中的記憶體,並針對大型語言模型((Large Language Model,LLM)與代理式AI運算流程產生的大量KV Cache進行最佳化,透過改善存取效能的方式大幅提升整體效能表現。NVIDIA表示搭配DOCA Memos框架使用的情況下,能夠帶將AI推論運算的資料傳輸量提升至通用儲存架構的5倍,並明顯提升電力效率。








Vera Rubin To the Moon!
Space-1 Vera Rubin模組是針對太空環境設計的加速運算平台,其CPU與GPU透過緊密整合的架構和高頻寬互連技術提供了所需效能和記憶體存取,能夠即時處理來自太空設備的龐大資料流,提供大規模的資料中心級 AI 能力,使大型語言模型和進階基礎模型得以直接在太空中運作,為軌道資料中心、先進的地理空間情報處理及自主太空營運等使用情境提供強悍且可靠的運算能力。
黃仁勳也在GTC 2026 GPU技術大會開幕演說中提到,雖然太空環境的溫度相當低,但是因為真空的關係無法透過傳導與對流方式散熱,僅能透過輻射方式排除晶片產生的廢熱是個相當大的挑戰,公司的眾多優秀工程師會努力解決這個問題。
此外NVIDIA也會將IGX Thor和Jetson Orin平台送上太空,以尺寸緊湊的模組提供高能效AI推論、圖像感知和加速資料處理能力,實現衛星軌道上的邊緣運算。


NVIDIA 創辦人暨執行長黃仁勳表示:「作為最後的前沿領域,太空運算時代已經到來。隨著我們部署衛星星座並更深入地探索太空,智慧必須存在於任何生成資料的地方。跨太空和地面系統的 AI 處理能力,能夠實現即時感知、決策制定和自主性,將軌道資料中心轉化為探索工具,並把太空飛行器轉化為自主導航系統。我們正與合作夥伴攜手,將 NVIDIA 的技術延伸到地球之外,大膽地將智慧帶到前所未及之處。」



