黃仁勛CES預言:另一個“時刻”快到來了
作者|小金牙 來源|字母AI(ID:faceaibang)
遲到10分鐘,黃仁勛身穿標志性的黑色夾克,走上拉斯維加斯國際消費電子展(CES)的舞臺。
黃仁勛總結剛剛走過的一年,尤其提到了開源的崛起起到的催化劑作用,而DeepSeek R1的出現意外地推動了整個行業的一年。
整個演講持續一個半小時,比起幾年前宣布開啟“AI的iPhone時刻”的震撼感,如今的英偉達聽起來更像是兢兢業業的世界“基礎設施部”——這是芯片,這是機架,這是網絡,這是軟件……哦對了,你們總說的那些機器人和汽車,理論上都要跑在這一整套東西之上。
這其中,今年CES的一條清晰主線,是對“全棧控制”的執念,尤其集中在存儲,以及英偉達反復強調的下一個瓶頸:具備代理能力(agentic)的AI。
它們需要更長的上下文、更大的內存、更強的網絡,以及更少諸如“現實世界跑不起來”的借口。
英偉達給出的說法是,“AI工廠”已經成為一個新的產品類別,而他們打算出售的不只是設備,而是藍圖、機器、操作系統,以及其余所有組成部分。
黃仁勛所公布的很多內容,其實已經流傳了好幾個月——Blackwell之后的Rubin架構、作為DPU躍遷的BlueField-4、英偉達號稱“開放”的Nemotron模型家族、作為安全框架的Halos。
真正的新意在于打包方式。英偉達正在把這條路線圖壓縮成一個完整論點:六款芯片,一個平臺,再加上網絡和“上下文內存”的底層管道,目的是讓長時序智能體不再輕易卡死。
01
基礎設施
在硬件層面,最核心的故事是:Rubin正在被拆解成可直接交付的“積木式”組件。
英偉達發布了一套由六個部分組成的Rubin“平臺”——包括Rubi和Rubin Ultra兩種規格的GPU與CPU,以及NVLink 6交換芯片和ConnectX-9 SuperNIC。
所有關于性能和“單token成本”的說法,都是建立在這種全系統協同設計之上,目標只有一個:壓低“智能”的成本。
在系統層面,英偉達將Vera Rubin NVL72定位為機架級的主力產品(72顆GPU、36顆CPU),而Rubin Ultra NVL288則是體量更大的后續版本(288顆GPU、144顆CPU)。

同時,英偉達還把Rubin納入DGX品牌的“AI工廠”體系中,將用于訓練的DGX Rubin NVL72與用于推理的DGX Rubin NVL8組合成更標準化、更即插即用的算力單元。
英偉達表示,基于Rubin的產品將于2026年下半年通過合作伙伴上市。
這里有兩項基礎設施層面的“外掛”在默默發揮關鍵作用。
第一,英偉達正把網絡當作一項一等性能特性來強調,主推Spectrum-X以太網光子交換系統,并給推理性能和能效都貼上了“提升五倍”的標簽。
第二,英偉達試圖把“長上下文”塑造成一次基礎設施采購決策,推出了名為“推理上下文內存(inference context memory)”的存儲平臺,用來擴展具備代理能力的AI的上下文窗口。
如果說Rubin的潛臺詞是“這條路線圖真的行”,那么圍繞它的這套底層管道系統的潛臺詞就是:“下一個利潤池,將在GPU之外。”
02.
開放模型
英偉達的“開放模型”敘事,與其說是出于意識形態上的覺醒、加入開源運動,不如說是一種更務實的策略:
用“免費樣品”把開發者吸引進自家生態——而這些樣品被精心打包,目的就是在英偉達基礎設施上跑得最好。
正如英偉達生成式AI與軟件副總裁Kari Briski所說,這是一次“擴展”。
公司將其包裝成一個整體方案:全新的Nemotron-3模型(包括70B、34B和8B三種規模的Llama Nemotron-3變體),再加上一批新數據集和工具,幫助團隊構建垂直領域智能體,并通過英偉達的技術棧完成部署。
“在2025年,英偉達是Hugging Face上最大的貢獻者之一——發布了650個開放模型和250個開放數據集。”Briski表示。
核心意思很明確:英偉達希望成為你開始的地方。
英偉達稱,其正在發布Nemotron-CC,這是一個多語言預訓練語料庫,覆蓋140多種語言,總規模達1.4萬億token,被定位為構建和微調模型的“開放”基礎層。
公司同時強調了一套名為“Granary”的指令數據集,目標是讓模型在企業級任務上“開箱即用”。
03
物理AI與機器人
英偉達不斷把“物理AI”描述為一個分水嶺時刻:當“智能體”不再只是能聊天,而是真正具備能力。也就是說,感知、推理和行動需要被放進同一個閉環里。
這意味著需要三塊打底的積木:更好的仿真、更好的機器人模型,以及更好的“運動(mobility)”模型。
黃仁勛在一份新聞稿中表示:“機器人領域的ChatGPT時刻已經到來。”
他認為,那些“能夠理解現實世界、進行推理并規劃行動”的模型,正在打開“全新的應用場景”。
也正因如此,汽車行業或許成了英偉達“全棧”敘事的真正試金石——這是一個“演示”和“落地”之間隔著監管、責任風險,以及十多年反復受挫的樂觀預期的領域。
英偉達稱,其用于輔助駕駛的Drive AV平臺已“進入量產階段”,將搭載于2026款梅賽德斯-奔馳CLA車型。該車型在2025年獲得了Euro NCAP的最高安全評分。
英偉達表示,這款車具備“先進的L2級自動駕駛能力”,支持“點到點的城市導航”,包括“從地址到地址”的完整行程;同時將Hyperion定位為提供安全冗余的計算與傳感器架構。公司還稱,該車型將在今年年底前具備在美國道路上脫手駕駛的能力。
更大的賭注在后面。
“我們相信,物理AI和機器人最終將成為全球最大的消費電子品類,”英偉達汽車業務副總裁Ali Kani表示,“所有會移動的東西,最終都會實現完全自動化,由物理AI驅動。”
Kani介紹稱,Alpamayo是英偉達面向自動駕駛推出的一整套“開源AI模型、仿真工具和物理AI數據集”家族,目標是加速“基于推理、以安全為核心的物理AI開發”。
英偉達同時發布了1700小時的駕駛數據,并配套一個開源仿真框架,將其定位為邁向L4級自動駕駛的入門工具包。
在機器人方面,英偉達重點提到了Isaac GR00T N1.6——一個面向機器人技能的開放式“視覺–語言–行動”推理模型,以及用于大規模測試策略的評估框架Isaac Lab Arena。
公司還提及Cosmos Reason 2,這是一個旨在提升物理推理能力的模型,而整個Cosmos系列則被定位為生成合成數據、用于訓練物理AI的工具鏈。
與此同時,英偉達將Jetson T4000定位為機器人的邊緣計算平臺,并與同一條從訓練到部署的流水線相連,最終回流至DGX級基礎設施。
英偉達正在努力讓“機器人技術棧”看起來像“軟件技術棧”:在它能生成的世界里訓練,在它能變化的世界里測試,并最終部署在它自己出售的硬件之上。
從更宏觀的角度看,英偉達在CES上釋放的信息在這三大板塊中高度一致:未來屬于“流水線”,而英偉達希望這條流水線的每一個環節——算力、網絡、存儲、安全、仿真——都運行在它已經出售的產品之上。
編者按:本文轉載自微信公眾號:字母AI(ID:faceaibang),作者:小金牙

前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。

























