免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

首頁 > 資訊 > 評論

理想闖入智駕“無人區(qū)”

2025/05/13 09:36      光錐智能


  文|劉俊宏

  “DeepSeek一開源,我們就加速了 9 個月的時間”。

  距離上一次AI Talk130天,作為車圈最高年薪的老板、理想汽車創(chuàng)始人、董事長兼CEO李想,再次發(fā)布了理想最新的智駕大模型——MindVLA(視覺-語言-動作)大模型。

  這款大模型曾在今年3月的英偉達GTC上亮相過,相比兩個月前的“炫技”,這次李想講了不少VLA的技術細節(jié)和產品表現。

  與理想上一代的端到端+VLM智駕對比,VLA不再是之前相互獨立的“雙系統”架構,而是一個具有智駕能力的多模態(tài)大模型。得益于訓練時添加的自動駕駛資料和人類文字語料,VLA終于實現了類似人類司機開車的表現。

  “ VLA是一個司機大模型,像人類的司機一樣去工作的一個模型。”

  正如李想所總結,根據本次公布的視頻顯示,基于VLA的輔助駕駛系統可以允許駕駛員用更靈活的方式完成人機共駕。一句話,智駕可以實現自動選路、掉頭、轉彎、停在指定停車場的位置等等。智駕的靈活度,顯著超出了當前主流智駕廠商所能提供的體驗。

  “它是最接近人類的,甚至有機會超過人類”,李想如此總結這VLA的能力和未來。同時,身處智駕安全性被市場懷疑的風口浪尖,李想認為VLA技術有機會為整個行業(yè)帶來轉機,“我覺得黎明馬上就要來了”。

  在整個智能汽車時代,理想是一家特立獨行的玩家。

  瞄準智能汽車“終點”的玩家有很多。認為汽車智能化的前提是充足的電動化,蔚來立志要把換電站建滿全國每一個角落;認為汽車工業(yè)的終點是規(guī)模與成本,比亞迪極致掌控生產的每一個環(huán)節(jié);認為汽車智能化就是將智能鋪滿每一個角落,華為要當中國智能汽車的“博世”。

  一直奔波于用戶需求的理想,在不斷積累的AI技術中,慢慢也構筑了自己的技術護城河。

  VLA到底是什么?在研發(fā)VLA的過程中,都有哪些技術細節(jié)?中國智能汽車廠商將在智駕研發(fā)中收獲什么?從理想的VLA中,我們看到了李想對智能汽車的“終極計劃”。

  “第十個包子”,一個大模型支撐起智駕

  端到端剛不到一年,智駕的架構又迭代了。

  在理想這次AI Talk上,李想詳細講述了之前發(fā)布的VLA技術——用更大的模型來“裝下”整個世界。

  相比之前“端到端+視覺”兩套模型的架構,這次是一個模型全部解決,視覺-語言-動作的三合一架構。

  一個大模型支撐智駕,已經成為智能汽車的最新趨勢。

  4月中旬,小鵬汽車也在香港披露了最新的智駕技術路線,用一個超大模型底座,支撐起整個智駕,再通過蒸餾落地到智能汽車的端側。

  顯然,這里有頭部技術大牛的英雄所見略同。

  回顧理想智駕的技術變化,經歷了從規(guī)則算法、端到端+VLM,直到VLA的“三級跳”�?梢郧逦乜闯觯珹I是如何逐步解決智駕中的研發(fā)痛點。

  在端到端時代,AI解決的是人力寫規(guī)則的痛點。由于端到端訓練模式相當于用AI來生成規(guī)則,節(jié)省了大量開發(fā)時間。所以,去年整個智能汽車市場一下子冒出不少宣稱能落地城市無圖NOA的玩家。

  但端到端對人類的模仿,終究難以超過人類的駕駛水平,智駕要想進一步升級,需要AI充當能思考的“大腦”。理想在端到端+VLM中,用了“快慢雙系統”的架構來讓智駕獲得深度思考能力。VLM是一個多模態(tài)大模型,能夠針對復雜場景進行更智能地“理解”。在看懂世界之后,VLM能調整端到端的行為,從而實現模擬人類大腦的“簡單反射與復雜反射”。

  但是“雙系統”的架構畢竟還是不夠靈活,相互獨立的雙系統架構難以聯合訓練。再加上VLM性能受到車端算力和芯片通信效率限制。實際推理效率達不到5赫茲的表現,很難做到實時推理。

  要想進一步提升端到端+VLM架構的能力,需要拿出一個更加整體的、能力足夠強的、有快速推理能力的智駕大模型。

  “我們對Deepseek R1從上線到后面開源都做了相當多的研究和擁抱。DeepSeek 的速度比想象中快,所以VLA到來的速度也比想象中快。”

  誠如李想在訪談中所言。理想在參考Deepseek的調整預訓練數據結構+后訓練+強化訓練的“三板斧”后,也拿出了對標人類智能的“司機大模型”——VLA。

  “訓練VLA的過程,特別像人去駕校學開車”,李想總結說。

  在預訓練階段,理想重新調整了VLA的訓練預料,增加了3D和自動駕駛相關圖文數據,并適當減少文史類數據的“投喂”。訓練之后,VLA基本上能夠媲美云廠商的通用大模型了。

  為了讓VLA提升輸出效率,理想重新調整了MoE混合專家架構,并對推理過程做了稀疏化處理。這一步操作,相當于VLA直接用AI整理好的資料來決策,大大縮短了推理耗時。

  在后訓練階段中,理想保留了“快慢思考”的思維模型。

  VLA的“快思考”模式不再直接輸出操控指令,而是輸出Action token(執(zhí)行代碼)。“慢思考”模式則是精簡了CoT(思維鏈),保證了模型的推理速度。面對復雜場景,“慢系統”還會模擬出汽車行駛軌跡,用類似人類“邊做邊想”的方式,在駕駛中不斷選擇最合適的路線。

  最后的強化訓練,說白了就是用人的標準來評價VLA的駕駛表現。大致就是設計一些指標,車開得舒服了,就給VLA加分;開得不舒服了或者違章了,就扣一分。一套下來,VLA就能學會怎樣成為一個“真正的司機”。

  “我覺得VLA(司機大模型),就是完全人類的運作方式了。”

  正如李想的總結,“(VLA)有l(wèi)anguage(語言),也有它的CoT(思維鏈),還有推理的能力,它能夠像人類一樣地,真正地去執(zhí)行這樣的行動”。對比自動駕駛早期規(guī)則和端到端時代的技術,李想認為VLA的突破,甚至可以將前兩個時代類比為“昆蟲智能”和“哺乳動物智能”。

  既然VLA這么強,是不是意味著其他智駕廠商也能快速跟進。甚至沒有智駕研發(fā)經驗的傳統車企也能跨過端到端,一步到位到VLA?

  跳過端到端實現 VLA 根本不可行,“沒有辦法直接吃第十個包子。雖然可能大家覺得第十個包子吃飽了,但前面每個包子其實都跳不過去”。

  隨后李想頓了頓,又總結了AI技術積累的重要性,“如果大家不想做前面任何包子的積累,只想吃第十個包子,就像是練葵花寶典。”

  兩年4級跳,理想的技術“開天眼了”?

  從2023年底,理想推送需要先驗信息的全場景NOA,到如今發(fā)布VLA。理想到底是怎么實現智駕能力“兩年4級跳”的?

  關于這個問題,光錐智能在今年的上海車展上幾乎問遍了每一個智駕供應商,但很可惜沒人說得清。其中一些智駕供應商工作人員還評價說,“就像是開天眼了一樣”。

  對于事務做出一針見血、穿透本質的判斷,再沿著正確的方向找到最短到達的路徑�;蛟S,這是理想能最快突破50萬輛年銷量,并且在兩年內智駕快速發(fā)展到第一梯隊的最重要的一個原因。

  在幾次和李想及理想智駕團隊深度溝通的過程中,光錐智能發(fā)現這種思維方式貫穿了許多理想解決問題時的方式。

  “當我們想去構建能力的時候,DeepSeek給你展示了一個最佳實踐,第一步一定要先搞研究。就是任何的時候,當我們想去改變能力和提升能力的時候,第一步一定是搞研究,研究完了才搞研發(fā)。”

  正如李想評價從Deepseek上學到的經驗——理想在研發(fā)VLA的時候,很多關鍵技術節(jié)點的迭代都算得上是“相互支撐”和“不謀而合”。

  作為佐證,李想在智駕團隊在芯片上優(yōu)化FP8(8 位浮點數格式)的時候,跟謝炎(理想汽車CTO)達成意見一致要訓練一個語言模型。但沒想到陳偉(理想汽車基座模型負責人)早就已經這么想了。“陳偉比我們還堅決”,李想說。

  為什么李想能夠發(fā)現軟件基礎相當重要?因為在開發(fā)VLM的時候,積累了軟件底層開發(fā)能力。“本來Orin芯片是不支持跑語言模型的。但因為英偉達沒時間,所以我們自己寫了底層推理引擎”,李想回憶說。

  如此一來,理想的汽車操作系統(星環(huán)OS)和基座大模型戰(zhàn)略也串聯了起來。

  針對芯片底層推理引擎的開發(fā),讓理想意識到了智駕芯片底層數據傳輸的邏輯。星環(huán)OS架構的搭建方式,就是圍繞智駕到車控這條通道而建設的。理想目前開源的,也正是車控操作系統、智能駕駛操作系統、通信中間件、虛擬化平臺這四個組件。

  另一邊,由于VLA算是一個通用多模態(tài)大模型,所以理想的整個汽車座艙也打通了語言與智駕之間的隔閡。

  在演示中看到,在輔助駕駛狀態(tài)下,駕駛員說出駕駛指令,車輛就能立馬執(zhí)行。無論是說走人工還是前面左轉,汽車都能在保持正常輔助駕駛的前提下,執(zhí)行新路線。

  對比目前主流其他智駕廠商,VLA當前展現的能力稱得上是“遙遙領先”。當其他智駕要駕駛員停車重新設置目標點的時候,理想不僅能保持流暢行車狀態(tài),而且還不需要司機說出具體的目的地。

  “它變得更像人。其實沒什么驚奇的,你都知道它的原理了”。

  正如李想所總結,“你跟司機怎么說話,那就怎么跟司機Agent說。短指令的話,VLA直接就能在車端處理了。長指令交給云端模型處理,然后再由VLA執(zhí)行。”當智駕能看懂世界、理解語言,還能懂你意思,VLA就變成了司機Agent。車輛成為能與用戶溝通、理解用戶意圖的智能體。

  如果說,去年發(fā)布端到端+VLM時候的理想,是想要炫耀端到端的能力。那么,如今的理想已經通過AI基礎技術研發(fā),構建起了軟件能力的護城河。

  但AI基礎研究的路線到底能通往哪里?李想不太能確定,“我覺得沒有辦法預測,我們前面沒有任何人走過這條路。DeepSeek沒走過,OpenAI、谷歌、Waymo也沒有走過這條路。”

  “我們其實走的是一個無人區(qū)”。

  理想和中國智能汽車,共闖無人區(qū)

  其實在整個智能汽車時代,中國汽車行業(yè)的玩家都是在“無人區(qū)”中摸索著前進。

  到底什么樣的汽車才算是智能汽車?車企要如何競爭才能取得時代勝利?近五年間,我們見證過太多“答案”。

  瞄準智能汽車“終點”的玩家有很多。認為汽車智能化的前提是充足的電動化,蔚來立志要把換電站建滿全國每一個角落;認為汽車工業(yè)的終點是規(guī)模與成本,比亞迪極致掌控生產的每一個環(huán)節(jié);認為汽車智能化就是將智能鋪滿每一個角落,華為要當中國智能汽車的“博世”。

  “理想的基因是為用戶創(chuàng)造價值。”

  正如李想在訪談中所言,今年即將迎來十歲生日的理想,走的是與行業(yè)其他玩家與眾不同的路子——在滿足用戶的需求中,在不斷地解決問題中成長。

  例如在汽車電動化及相關配套設施還不完善的時期,理想先推出了增程式的車型滿足用戶需求。用“冰箱彩電沙發(fā)”定義了早期汽車智能的“模板”。而彼時的汽車行業(yè)還在糾結,增程式到底是不是落后技術,“冰箱彩電沙發(fā)”到底算不算是“花架子”。

  站在2025年的上海車展上,“冰箱彩電沙發(fā)”早已成了每一輛新車的標配。汽車行業(yè)也早就沒了關于增程技術落后的討論,反而是不少消費者“要求”純電汽車品牌也推出增程式版本。

  “到了今天,還能看到至少有5個的企業(yè)是因為當時理想L9的成功,在打造跟理想L9相同的產品。”李想說。

  專注滿足用戶需求的結果,就是理想汽車在過去的五年中,合計賣出超過100萬輛車。李想今年年初的內部信,定下了2025年要占據20%中國智能電動車市場份額的目標。換算下來,銷量要達到160萬輛。

  “我只能做最好的自己,在自己長板的延長線上來做,而延長線最終帶來了無人區(qū)。”

  誠如李想所說,理想的成就是不斷延長自身優(yōu)勢的結果。但如果我們用更大的尺度觀察中國汽車行業(yè)。中國智能汽車行業(yè)如今領先全球的盛況,其實也是各家車企不斷探索自身“長板”的結果。

  二十年前,中國汽車想要實現技術突破非常困難。在全球汽車巨頭早已搭建好的利益關系網中,任何中國車企技術研發(fā)都要面臨國際技術專利的壁壘。想要拿下技術授權,想要在海外銷售自主品牌,就得仿照吉利收購沃爾沃。

  在智能汽車時代,如今的中國汽車產業(yè)鏈已經有不少玩家“不怎么在乎”國際巨頭的技術封鎖了。

  例如在智駕上,中國已經有不少廠商開始了對外輸出(小鵬、地平線、Momenta、華為等)。在汽車OS的設計上,不只是理想的星環(huán)OS,還有不少芯片廠商也參與了車機系統的設計,例如地平線的HSD界面、鴻蒙車機等。在國外汽車巨頭最自豪的底盤調教環(huán)節(jié)中,比亞迪、華為、蔚來等玩家在用智能底盤攻城略地。

  要知道,過去中國汽車產業(yè)鏈用的幾乎都是國際巨頭們已經“給好”的模板。

  “我覺得DeepSeek的出現,對我們加速做VLA是巨大的幫助。”談到為什么決定開源星環(huán)OS,李想感慨萬分,“我們受到了那么大的幫助,所以在想我們能對社會做點什么貢獻”。

  光錐智能大致看了下開源文件,readme文件(可以理解為是說明書)寫的比較詳細,理想真的想讓大家用起來。

  當前,汽車操作系統已經被提升到智能汽車“新三大件”,理想的星環(huán)OS大概率不會像Deepseek一樣,被各大汽車廠商“拿來就用”。但對于汽車行業(yè)來說,有星環(huán)OS作為參考,一定是一件好事。

  越開放、越上升,這樣的技術和產業(yè)的螺旋式升級,不只發(fā)生在智能汽車和AI產業(yè)鏈里,最終,將潤物細無聲般地滲透到中國經濟的方方面面。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞