《Without Your Shotgun》復(fù)古又動感的旋律戛然而止,穿著閃亮的新夾克,英偉達(dá)CEO黃仁勛走向CES的舞臺中央。
“Are you excited in Las Vegas(你們喜歡拉斯維加斯嗎)?”“Do you like my jacket(你們喜歡我的夾克嗎)?”
而在此之前,整個拉斯維加斯都在屏息以待,直到黃仁勛掏出了RTX 50系列消費(fèi)級顯卡(GPU),會場才被掌聲與歡呼聲淹沒。
這是黃仁勛時隔多年再次來到CES(Consumer Electronics Show,國際消費(fèi)類電子產(chǎn)品展覽會)發(fā)表主題演講,上一次還是在2019年,他在CES上發(fā)布了RTX 20系列顯卡。
當(dāng)?shù)貢r間下午2點(diǎn),距離活動開始還有4個小時,就有參會者來到了演講會場Mandalay Bay Arena。演講開始前,會場門口已經(jīng)排起了看不到頭的隊(duì)伍,在人群中,一位觀眾對“甲子光年”調(diào)侃:“這幾個小時我已和旁邊人嘮成朋友,再等下去就快成兄弟了。”
全世界的媒體也將目光聚焦在英偉達(dá)。
“我主要期待英偉達(dá)在芯片、機(jī)器人和在汽車方面的新動作。”一位來自日本的電視記者對“甲子光年”說道。而來自印度報業(yè)托拉斯的記者Yashita則表示,去年10月英偉達(dá)推出印地語AI模型,所以她更關(guān)注這次新發(fā)布會對印度AI產(chǎn)業(yè)帶來的促進(jìn)與影響。
這一次,黃仁勛的主題演講有以下重點(diǎn)內(nèi)容:
發(fā)布史上最快的消費(fèi)級顯卡RTX 5090;
提出Scaling Law仍在繼續(xù),并表示要創(chuàng)建一個名為Grace Blackwell NVLink72的巨型芯片;
在NIM微服務(wù)中新增Nemotron系列模型和用于視頻搜索和摘要的AI代理,入局Agentic AI;
發(fā)布Nvidia Cosmos世界基礎(chǔ)模型平臺,以助推Physical AI的發(fā)展;
發(fā)布人形機(jī)器人合成數(shù)據(jù)藍(lán)圖Isaac GR00T Blueprint和新一代智駕芯片Thor;
發(fā)布全球最小的個人AI超級計算機(jī)Project DIGITS。
FPSolution VC創(chuàng)始合伙人、SpaceX前華裔高管Lewis Hong在聽了黃仁勛的演講后做了一個大膽的推斷:“英偉達(dá)接下來也許會直接吃掉所有‘Magnificent 7’的‘餅’,或許*可以跟他們抗衡的只有Elon Musk(埃隆·馬斯克)了。”
“Magnificent 7”指的是當(dāng)前科技領(lǐng)域*影響力的七家公司:微軟(MSFT)、亞馬遜(AMZN)、Meta Platforms(META)、Alphabet(GOOGL)、蘋果(AAPL)、特斯拉(TSLA)、英偉達(dá)(NVDA)。
1小時35分鐘的演講,黃仁勛的每一句話都像是一枚精準(zhǔn)投射的芯片,深深嵌入了觀眾的腦中,而這些“芯片”包括了英偉達(dá)的陽謀與野心。
一、史上最快的消費(fèi)級顯卡
在黃仁勛這次演講中發(fā)布的產(chǎn)品中,最受關(guān)注的莫過于RTX 5090。
RTX 5090是迄今為止最快的GeForce RTX GPU,在Blackwell架構(gòu)創(chuàng)新和DLSS 4的加持下,RTX 5090的性能是RTX 4090的2倍。
它在多款熱門游戲中都表現(xiàn)優(yōu)異,這些游戲包括《賽博朋克2077》《黑神話:悟空》等,同時在D5 Render渲染器上也有不錯的表現(xiàn)。
RTX 5090和RTX 4090性能對比
但也有現(xiàn)場觀眾對“甲子光年”表示,這些游戲的測試結(jié)果參考價值有待商榷。比如,《瘟疫傳說:安魂曲》這款游戲在使用了DLSS 3(NVIDIA的深度學(xué)習(xí)超級采樣技術(shù)第三代)和光追技術(shù)(RT)的情況下,RTX 5090的性能提升也不到50%,其相對于RTX 4090的性能提升低于預(yù)期,特別是光柵化性能增長幅度較小,光追性能也沒有得到充分驗(yàn)證。
從參數(shù)上來說,RTX 5090擁有920億個晶體管,具備4000 AI TOPS(每秒萬億次操作)的性能,能夠?qū)崿F(xiàn)380 RT TFLOPS(每秒萬億次浮點(diǎn)運(yùn)算)的光線追蹤性能,具備1.8 TB/s的內(nèi)存帶寬,能夠快速地讀取和寫入數(shù)據(jù),具有125 Shader TFLOPS的著色器性能。
與RTX 5090 GPU一同發(fā)布的是RTX 50全系列產(chǎn)品,包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是,與4090發(fā)布時的1599美元相比,售價為1999美元的5090還是漲價了。
與此同時,搭載了RTX 5070的AI PC也在CES上發(fā)布。這臺5070筆記本電腦具有與4090相當(dāng)?shù)男阅�,但能耗只�?090的一半。
“很難以置信對吧,我們把一個4090顯卡縮小并塞到了這臺筆記本電腦里!”黃仁勛有些得意地說。
黃仁勛表示,之所以能實(shí)現(xiàn)這一技術(shù),是因?yàn)橛ミ_(dá)使用Tensor Core(張量計算核心)生成了大部分像素,先回溯需要的像素,然后再用AI生成其他像素,“能源效率已經(jīng)超出預(yù)期,計算機(jī)圖形學(xué)的未來是神經(jīng)渲染,它是人工智能和計算機(jī)圖形學(xué)的融合。”
RTX 50系列AI PC的價格也隨之公布,其中搭載了RTX 5090顯卡的AI PC售價為2899美元。
二、超級芯片隊(duì)長
發(fā)布完RTX 50系列顯卡后,黃仁勛話鋒一轉(zhuǎn),開始大談AI。
在關(guān)于Scaling Law是否“撞墻”的討論絡(luò)繹不絕的當(dāng)下,黃仁勛堅信Scaling Law仍在繼續(xù),而且除了Pre-Training Scaling Law(預(yù)訓(xùn)練縮放定律)之外,還出現(xiàn)了后兩個階段的Scaling Law,分別是Post-training Scaling law(后訓(xùn)練縮放定律)和Test-Time Scaling Law(測試時間縮放定律)。
這個表態(tài)并不讓人意外,畢竟Scaling Law與英偉達(dá)的生意息息相關(guān)。
黃仁勛表示,從ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro,這些新模型的強(qiáng)大能力都印證了Scaling Law的延續(xù)。
在演講現(xiàn)場,黃仁勛還向大家展示了包括液冷、風(fēng)冷、x86服務(wù)器等在內(nèi)的Blackwell全系列產(chǎn)品。
“當(dāng)然,我們需要的計算量是驚人的,我們希望社會有能力擴(kuò)展計算量,以生產(chǎn)越來越多更新、更好的產(chǎn)品。Scaling Law正在推動對Nvidia計算的巨大需求,也推動了對Blackwell架構(gòu)芯片的巨大需求。”黃仁勛從自己的角度說了大實(shí)話。
介紹完Blackwell全系列產(chǎn)品后,黃仁勛拿出了一個巨大的芯片,并擺出了一個驚訝全場的造型,儼然成為了漫威電影中的“美國隊(duì)長”。
他手里拿著的是GB200 NVLink 72的展示樣品。這個巨大的晶圓上有72個Blackwell GPU和144個芯片,擁有14TB的內(nèi)存,和1.2PB/s的帶寬,AI浮點(diǎn)性能達(dá)到了1.4 ExaFLOPS,與上一代相比每瓦性能提高了4倍。
“基本上全世界的互聯(lián)網(wǎng)流量都能在這個芯片上進(jìn)行處理。”盡管聽起來有些夸張,但“超級芯片隊(duì)長”黃仁勛就是這么說的。
三、代理型AI助力企業(yè)工作流自動化
基座模型是生成式AI的基石。
在演講現(xiàn)場,黃仁勛推出了基于Llama的一系列模型,包括Llama Nemotron Nano、Super和Ultra。它們涵蓋從PC和邊緣設(shè)備到大型數(shù)據(jù)中心等所有領(lǐng)域。
英偉達(dá)還發(fā)布了運(yùn)行在NVIDIA RTX AI PC上的基礎(chǔ)模型,可增強(qiáng)數(shù)字人、內(nèi)容創(chuàng)造、生產(chǎn)力和開發(fā)能力。
這些模型都以NIM微服務(wù)的形式提供。NIM微服務(wù)是由Black Forest Labs、Meta、Mistral和Stability AI等*模型開發(fā)商為RTX AI PC開發(fā)的關(guān)鍵組件,可以部署在RTX PC、工作站和云端。其用例涵蓋大型語言模型(LLM)、視覺語言模型、圖像生成、語音、用于檢索增強(qiáng)生成(RAG)的嵌入模型、PDF提取和計算機(jī)視覺等。
同時,NIM微服務(wù)還將與*AI開發(fā)和代理框架兼容,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。
總結(jié)來看,英偉達(dá)為幫助生態(tài)系統(tǒng)構(gòu)建代理型AI做了三件事:
Nvidia Nims,它基本上是一個打包好的人工智能微服務(wù);
Nvidia Nemo,本質(zhì)上是一個數(shù)字員工入職和培訓(xùn)評估系統(tǒng),英偉達(dá)可以幫助客戶的數(shù)字員工(人工智能代理)做培訓(xùn)、以適應(yīng)客戶公司的具體業(yè)務(wù);
Nvidia AI Blueprints,它提供了一整套藍(lán)圖,用于將PDF轉(zhuǎn)換為播客,以及另一個用于構(gòu)建視頻搜索和摘要的AI代理。此外,還有四個額外的NVIDIA Omniverse藍(lán)圖,使開發(fā)人員能夠更輕松地為物理AI構(gòu)建可用于模擬的數(shù)字孿生。
在發(fā)布會現(xiàn)場,黃仁勛還展示了Project R2X。這是一個支持視覺的PC化身,可以將信息放在用戶的指尖,協(xié)助桌面應(yīng)用程序和視頻會議通話,閱讀和總結(jié)文檔等。
四、AI的下一個前沿是物理AI
演講過半,黃仁勛突然向現(xiàn)場觀眾提出了一個問題。
“想象一下,你正在給大模型做上下文提示,按照我的習(xí)慣,我可能會在問問題之前上傳幾個PDF文件。這些PDF被大模型轉(zhuǎn)換成tokens,因此這些PDF文件可能被轉(zhuǎn)換成數(shù)十萬個tokens,并且通過Transformer的每一層進(jìn)行處理。但如果我上傳的不是PDF,而是周圍的環(huán)境怎么辦?如果你在上傳之后你給大模型的不是提示,而是一個請求,讓它去某地拿起一個盒子并且把它帶回來怎么辦?”
黃仁勛其實(shí)是想引出AI與物理世界的關(guān)系。
“甲子光年”去年5月就曾提出,能源、信息和行為是現(xiàn)代社會和自然界中三個基本而相互關(guān)聯(lián)的概念——科技的進(jìn)步,就是三者之間轉(zhuǎn)化能力加強(qiáng)的反映。隨著AI對物理世界映射能力的不斷優(yōu)化,其將會在實(shí)踐中構(gòu)建一條AI影響世界發(fā)展的動態(tài)平衡線。
圖片來源:《張一甲:AI創(chuàng)生時代,2024中國AI新風(fēng)向30條判斷》
2024年,讓AI理解物理世界,成為了AI產(chǎn)業(yè)界的新浪潮。
曾經(jīng)在英偉達(dá)工作過的群核科技董事長黃曉煌告訴“甲子光年”:“這幾年,隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,用機(jī)器模擬人腦已經(jīng)獲得了巨大突破,標(biāo)志性事件就是ChatGPT的誕生。但我們也意識到,我們發(fā)展AI本來是希望AI能替代人類打掃衛(wèi)生、做家務(wù),現(xiàn)在卻是人類在打掃衛(wèi)生、做家務(wù),而AI在寫詩作畫。所以,讓AI從虛擬世界走入物理世界,去幫人類執(zhí)行物理世界的任務(wù),是技術(shù)發(fā)展的必經(jīng)之路。”
這次CES上,黃仁勛揭幕了英偉達(dá)的下一代重磅產(chǎn)品——Nvidia Cosmos世界基礎(chǔ)模型平臺。
世界基礎(chǔ)模型(WFM),指的是通過輸入多種模態(tài)的數(shù)據(jù)(包括文本、圖像、視頻和動作)來生成和模擬虛擬世界,從而準(zhǔn)確地模擬場景中物體的空間關(guān)系及其物理交互的模型。
Nvidia Cosmos是一個用來加速物理AI(能夠讓機(jī)器人和自動駕駛汽車等自主機(jī)器感知、理解和執(zhí)行物理世界中的復(fù)雜動作的AI)開發(fā)的平臺,它由一套開源的擴(kuò)散(Diffusion)和(Auto-regressive)模型組成,用于生成物理感知視頻。這些模型在2000萬小時的現(xiàn)實(shí)世界人際互動、環(huán)境、工業(yè)、機(jī)器人和駕駛數(shù)據(jù)之上訓(xùn)練而成,包含9000萬億個tokens。
該平臺將模型分為了三類:
Nano,針對實(shí)時、低延遲推理和邊緣部署進(jìn)行了優(yōu)化的模型;
Super,針對高性能基線模型;
Ultra,針對最高質(zhì)量和保真度,最適合用于提煉自定義模型。
具身智能創(chuàng)業(yè)者Edward告訴“甲子光年”,他這次最關(guān)注的是開源的世界模型,Cosmos World Foundation Model開源模型讓訓(xùn)練的門檻變低了,對數(shù)據(jù)的需求減少了,這對于機(jī)器人開發(fā)非常重要。
“通過‘Sim-to-Real’的方式,我們可以更快地實(shí)現(xiàn)像自動駕駛領(lǐng)域那樣的突破。特別是英偉達(dá)在這方面的優(yōu)化,讓‘Sim-to-Real’的質(zhì)量更高了,這對整個行業(yè)的進(jìn)展幫助很大。”Edward說。
除了幫助生成大型數(shù)據(jù)集外,Nvidia Cosmos還能通過將圖像從3D擴(kuò)展到真實(shí)場景,縮小仿真與現(xiàn)實(shí)之間的差距。將Omniverse(一個用于構(gòu)建3D應(yīng)用程序和服務(wù)的應(yīng)用程序編程接口和微服務(wù)開發(fā)平臺)與Cosmos相結(jié)合至關(guān)重要,通過其高度可控、物理精確的仿真提供關(guān)鍵保障,有助于*限度地減少世界模型常見的幻覺問題。
目前,Nvidia Cosmos已在Github上開源。開發(fā)人員可以根據(jù)自己的需求,直接使用Cosmos平臺上的模型來生成基于物理的合成數(shù)據(jù),也可以用NVIDIA NeMo框架通過自己的視頻對模型進(jìn)行微調(diào),以適應(yīng)特定的物理AI設(shè)置。
Nvidia Cosmos主要用于機(jī)器人和自動駕駛場景,目前,1X、Agility Robotics等機(jī)器人公司和XPENG、Uber和Waabi等自動駕駛公司都已經(jīng)與Cosmos合作開發(fā)模型。
“The next frontier ofAIis Physical AI。(AI的下一個前沿是物理AI)”這句話,去年年中黃仁勛就說過,這一次在CES 2025,他又一次面向世界強(qiáng)調(diào)了一遍。
五、合成數(shù)據(jù)與新一代智駕芯片
人形機(jī)器人是一個380億美元的超級市場,英偉達(dá)自然不會放過這一超級風(fēng)口,很早就發(fā)布了一系列機(jī)器人基礎(chǔ)模型、數(shù)據(jù)管線和仿真框架,以加速下一代人形機(jī)器人的開發(fā)進(jìn)程。
“通用機(jī)器人的ChatGPT時刻即將到來。”黃仁勛在演講中下了判斷。
他宣布英偉達(dá)正式推出用于合成運(yùn)動生成的NVIDIA Isaac GR00T Blueprint,該Blueprint可幫助開發(fā)者生成海量的合成運(yùn)動數(shù)據(jù),以便通過模仿學(xué)習(xí)來訓(xùn)練人形機(jī)器人。
模仿學(xué)習(xí)是機(jī)器人學(xué)習(xí)的一個子集,它能讓人形機(jī)器人通過觀察和模仿人類專家的示范來獲取新技能。在真實(shí)世界中收集這些廣泛、高質(zhì)量的數(shù)據(jù)集既繁瑣又耗時,而且成本往往高得令人卻步。通過用于合成運(yùn)動生成的Isaac GR00T Blueprint,開發(fā)者只需少量人類示范,就能輕松生成海量的合成數(shù)據(jù)集。
自動駕駛汽車同樣是英偉達(dá)關(guān)注的焦點(diǎn)。在演講中,黃仁勛宣布英偉達(dá)推出下一代智駕芯片“Thor”。此前,英偉達(dá)Thor芯片原本計劃于2024年年中量產(chǎn),但后來進(jìn)度大幅推遲。
1月7日,極氪汽車宣布,未來新車型將搭載NVIDIA Thor智駕芯片。此外,極氪與自動駕駛公司W(wǎng)aymo基于SEA-M架構(gòu)聯(lián)合開發(fā)的全球*量產(chǎn)原生無人駕駛汽車——ZEEKR RT將在2025年開啟大規(guī)模交付。
值得注意的是,在現(xiàn)場公布的將搭載Thor智駕芯片的車企中沒有蔚來,這或許與蔚來去年7月宣布其自研的智駕芯片“神璣NX9031”正式流片有關(guān)。
英偉達(dá)還展示了其最新的自動駕駛平臺——Hyperion 9以及DriveOS系統(tǒng)。Hyperion 9平臺基于英偉達(dá)最新的Blackwell架構(gòu)打造,它配備了12個攝像頭、9個雷達(dá)、1個激光雷達(dá)、12個超聲波傳感器,在傳感器配置和處理能力上都有顯著提升。
六、全球最小的個人AI超級計算機(jī)
在演講的最后,黃仁勛發(fā)布了一款令人眼前一亮的產(chǎn)品——AI超級計算機(jī)Project DIGITS。
就像變魔術(shù)一樣,黃仁勛把一個超級計算機(jī)“變小”,然后拿了出來。
該計算機(jī)是基于此前的AI超級計算機(jī)DGX-1升級而成,但體積更小,功能更強(qiáng)。通過Project DIGITS,用戶可以使用自己的桌面系統(tǒng)開發(fā)和運(yùn)行模型推理,然后在加速云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上無縫部署模型。
Project DIGITS搭載了全新的Grace Blackwell超級芯片(GB10),在FP4精度下可以提供高達(dá)1千萬億次浮點(diǎn)運(yùn)算的AI性能。GB10采用NVIDIA Blackwell GPU,配備最新一代CUDA核心和第五代Tensor核心,通過NVLink-C2C芯片到芯片互連連接到高性能NVIDIA GraceCPU,其中包括20個采用Arm架構(gòu)構(gòu)建的節(jié)能核心。
GB10超級芯片使Project DIGITS僅使用標(biāo)準(zhǔn)電源插座即可提供強(qiáng)大的性能。每臺Project DIGITS都具有128GB的統(tǒng)一、一致內(nèi)存和高達(dá)4TB的NVMe存儲。借助這臺超級計算機(jī),開發(fā)人員可以運(yùn)行多達(dá)2000億個參數(shù)的大型語言模型,從而增強(qiáng)AI創(chuàng)新。此外,使用NVIDIA ConnectX網(wǎng)絡(luò),兩臺Project DIGITS AI超級計算機(jī)可以連接起來,運(yùn)行多達(dá)4050億參數(shù)的模型。
正如前文所說,1小時35分鐘的演講,黃仁勛的每一句話都像是一枚精準(zhǔn)投射的芯片,深深嵌入了觀眾的腦中。
而這一枚枚芯片又如同種子一樣在觀眾腦海中快速生根發(fā)芽,并開出了未來之花。
這是一種很難用語言形容這樣的感受,直到會場里的標(biāo)語提醒了我們——“Step Into Tomorrow”(走向明天)。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...