首頁 > 新聞 >

李想帶著理想,走向AI「無人區」

發布時間:2025-05-09 10:30   來源:投資界   閱讀量:9288   

理想的AI Talk 第二季,時隔130天后,終于回歸。

最新一季訪談中,李想不僅談到了對人工智能的最新思考,以及當下輔助駕駛的情況,還涉及了DeepSeek、特斯拉、蘋果等眾多AI公司。

在李想看來,目前輔助駕駛雖然處于十字路口,但對理想影響不大,今天的輔助駕駛就像正處于黎明前的黑暗時刻,輔助駕駛行業遇到了問題,恰恰是理想證明自己價值所在的時刻。

早在*季,李想在訪談上就提出了自己的觀點,理想是一家人工智能企業,我們要做的不是汽車的智能化,而是人工智能的汽車化。

面向人工智能時代,理想的邏輯是當AI成為生產工具時,人工智能才會迎來爆發時刻。

如今,人工智能的汽車化,理想已經有了具象的體現——VLA 司機大模型。

李想也坦言,做 VLA司機大模型,像走向一個無人區,Deepseek 沒有走過這條路,OpenAl 沒有走過這條路,谷歌、Waymo 也沒有走過這條路。

01

AI要成為生產力工具

訪談剛開始,李想就拋出一個事實——雖然人工智能國內發展很快,但自己每天的工作時間并沒有減少,還是在增加。

這是因為大多數人還把AI當做信息工具,李想認為AI僅僅作為信息工具是不*的,某種程度上,眼下的 AI 仍然是在做熵增,會增加大量的無效信息、無效結果、無效結論。

正視AI的工具屬性,也是李想在過去的幾個月,在內部跟很多人重點討論的問題。

李想把AI工具分為三個層級,分別是信息工具、輔助工具和生產工具,作為信息工具時,僅具備參考價值。

如果把AI視為輔助工具,可以提升效率,比如現在的輔助駕駛功能,或者用語音的方式來進行導航,打開美團或者聽歌等,它會讓我們的效率更高,但仍然離不開我們。

什么時候,能真正改變我們的工作的成果以及減少工作時長,就會變成生產工具,也就是Agent的誕生,在李想看來,那時才是人工智能真正爆發的時刻。

“判斷Agent是否真正智能,關鍵在于它是否成為生產工具。就像人類會雇傭司機,人工智能技術最終也會承擔類似職責,成為真正的生產工具?!?/p>

為了迎接這個時刻,理想的“VLA司機大模型”應運而生,也可以稱為司機 Agent,在李想看來,VLA司機大模型就是成為交通領域專業的生產工具。

其實在一個月前,理想汽車的下一代自動駕駛架構VLA就已經亮相了,VLA是視覺-語言-行為大模型,它將空間智能、語言智能和行為智能統一在一個模型里,賦予了模型強大的3D空間理解、邏輯推理和行為生成能力,讓自動駕駛能夠感知、思考和適應環境。

所以它既是一個能與用戶、理解用戶意圖的智能體,也是一名聽得懂、看得見、找得到的專屬司機。

而李想希望這個智能體,能像人類司機一樣工作,將來也能像人類司機那樣創造商業價值。

在訪談中,理想還展示了搭載了VLA司機大模型的 demo 演示視頻,在視頻里,理想的這個“司機 Agen”展示了和人類司機類似的智能能力,不僅具備現有的優秀輔助駕駛能力,而且還能直接通過語音的方式和人類駕駛員高效交互。

比如在通過高速收費站時,直接說出“走人工”三個字,系統就可以從 ETC 收費通道轉向人工收費通道,在日常駕駛和泊車環節,也可以通過“前方掉頭”、“C 區停車”、“靠邊停車”等簡單指令,調整行車或泊車的路線。

換句話講,人類和VLA之間類似人和代駕的關系,人們怎么和代駕說,就怎么和司機Agent說。

在主持人提問試駕VLA的車有沒有驚喜時刻時,李想頗為“凡爾賽”地表示,挺難有什么驚喜時刻,因為當你把它當做一個人看待時,它所呈現出的表現就很正常。

當然,當普通用戶*次看到 VLA 的測試視頻的時候,還是會驚訝于它的表現。

在談及VLA司機大模型的時候,李想特意先感謝了DeepSeek,正是因為當初DeepSeek的開源,才讓VLA推出的速度比原來的預期要快。

按照李想的說法,其內部原本打算要到今年年底才能做出能夠滿足需求的語言模型,但DeepSeek一開源,瞬間就加速了9個月的時間。

不過DeepSeeK的開源只是加速了 VLA的L(language 語言)的部分,像VL(視覺和語言)的組合語料,無論是OpenAI還是DeepSeek,都沒有這樣的數據,也沒有這樣的場景和需求,只能自己來做。

按照李想的話說,“我可以站在巨人的肩膀上,但是它只是我其中的一部分”。

其更是在訪談上直言,自己之所以將自研的整車操作系統理想星環OS給開源了,一方面是出于對DeepSeeK的感謝,一方面也是因為受到了那么大的幫助,所以自己認為應該對社會做點什么貢獻,不讓行業這么卷。

02

輔助駕駛的三個階段

VLA就像一個「司機大模型」,可以像人類司機一樣工作,不過 VLA 的誕生不是突變,而是進化,畢竟“沒有辦法直接吃第十個包子”。

整個過程經歷了三個階段,對應了理想汽車輔助駕駛的昨天、今天和明天。

*階段,李想將其比喻為“昆蟲動物智能”:通過機器學習感知配合規則算法的分段式輔助駕駛解決方案,有既定的規則,同時還依賴高精地圖,類似螞蟻完成任務的方式。

僅僅百萬量級的參數自然無法完成更復雜的事情,因此需要不斷地加限定規則,形成類似“有軌交通”的形式。

這對應了理想汽車自2021年起,通過自研依賴規則算法和高精地圖的輔助駕駛方案。

而第二階段則對應了理想汽車自2023年起研究,并于2024年正式推送的端到端+VLM輔助駕駛。

李想將其稱之為“哺乳動物智能”階段:通過端到端大模型學習人類駕駛行為,比如馬戲團里的一些動物像人類學習怎么騎自行車,它們能學會人類的各種行為,但其本身對物理世界的理解并不充分。

因此需要通過三維圖像判斷自身速度和軌跡以及在空間中所處的位置,雖然足以應對大部分泛化場景,但很難解決從未遇到過或特別復雜的問題,此時需要配合視覺語言VLM模型,但現有視覺語言模型在應對復雜交通環境時只能起到輔助作用。

在端到端的基礎上,才能來到第三階段,也就是李想說的“人類智能”的階段,給出的答案就是VLA司機大模型。

它能通過3D和2D視覺的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時,VLA擁有完整的腦系統,具備語言、CoT推理能力,既能看,也能理解并真正執行行動,符合人類的運作方式。

李想還列舉了端到端+VLM架構可能無法解決,但VLA(視覺語言行動模型)可以解決的corner case(長尾案例)。

03

怎么才能像人一樣開車

至于如何訓練VLA,李想也做了詳細的闡述,整個過程就像人學會如何開車一樣。

*步是預訓練,這一步的目標是讓AI擁有對世界和交通的基礎認知,就像人先學習各種交規知識一樣。

這一步放入足夠多的Language,Vision的語料和token。其中Vision包含兩個部分,一部分是物理世界的3D Vision,另一部分是高清2D Vision,然后再放入VL(視覺和語言)聯合的數據,例如將導航地圖和車輛對導航地圖的理解同時放入訓練集中。

從而形成一個VL的基座模型,然后會被“蒸餾”成一個更小、能更快運行的約 32B 端側的模型,保證它運行速度足夠得順暢。

第二步是后訓練,在VL的基礎上加入Action,Action部分的后訓練類似人類去駕校學開車,能夠直接從視覺到理解再到輸出,形成一個初級的 VLA「端到端」模型。

李想還強調,不會做長思維鏈,一般是兩步到三步,否則長時延會無法滿足安全性。另外,當 Action 完成后,VLA 還會根據性能做4-8秒的擴散模型,預測軌跡和環境。

第三步屬于強化學習,主要分為兩部分,一是RLHF,基于人類反饋的強化學習,會參考大量人類司機的駕駛數據,當它做得好時得到鼓勵,做得不好的時候,會得到反饋。

同時,理想汽車搭建了一個非常逼真的虛擬“交通世界”,有點像一個超高水平的模擬器,讓AI在里面自己練習,這部分屬于純粹的強化學習。

在訓練指標上,理想會通過G值來判斷輔助駕駛的舒適性,同時做碰撞的反饋,還有交通規則的反饋。

不難看出,第三步,就相當于人類拿到駕照后,來到社會上來開車來強化自己的駕駛技能。當這三個步驟完成了以后,VLA 能夠跑在車端的模型其實就產生了。

但還沒有完事,這時雖然有了VLA司機大模型,但還無法做到人類跟VLA的交互,這時候理想就需要搭建一個司機 Agent,用自然語言教輔助駕駛系統應該如何開車。

如果是一些短指令,通用的短指令VLA司機大模型直接就處理了,不需要再經過云端。如果是一些復雜的指令,其實先要到云端的 32B 的基座模型那里,VL處理完以后,再整個交給VLA司機大模型來進行處理。

在李想看來,VLA是現階段能力最強的架構,它的能力是最接近人類的,甚至有機會超過人類。但不一定是最*的架構。

“是否是一個效率最高的方式,是否有效率更高的架構出現,這些還要打個問號,我認為大概率還是會有下一代架構的?!?/p>

就像他說的那樣,前面沒有任何人走過這條路,理想其實走的是一個無人區。

“理想以前走的是汽車的無人區,以后走的是人工智能的無人區?!?/p>

(責編:山歌)

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

版權聲明:凡注明“來源:“生活消費網”的所有作品,版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用,須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名,否則將追究相關法律責任。

  • 電動化驅動碳減排成效顯著,中國汽車漸顯綠色競爭力
    電動化驅動碳減排成效顯著,中國汽車漸顯綠色競爭力 在汽車行業技術與產品加速革新的當下,第三方測評的重要性愈發凸顯。作為“汽車測評國家隊”,中汽中心聯合行業、高校共同編制并發布《中國汽車測評報告》,從......
    2025-05-09 10:26
  • 【城市色彩檔案】弘藝豐集團&蘇州印象城藝術生活節成功舉辦!
    5月1日,由弘藝豐集團與蘇州印象城聯合舉辦的【城市色彩檔案】藝術生活節在蘇州印象城一樓中庭正式啟幕。藝術生活節通過“主題書畫藝廊”“大型藝術裝置”和“弘云藝術市集”三個板塊的有機融合,吸引眾多游客參與......
    2025-05-09 10:06
  • 吉利私有化極氪的用意,很多人沒看懂
    吉利私有化極氪被很多人說成業績不佳、被迫退市。其實本質是一個傳統汽車巨頭對資本市場不分好歹的不滿,也開天眼般看到了未來的汽車市場格局。 憑什么極氪去年各項銷量、財務指標都遠好于蔚來汽車,但宣布私有化......
    2025-05-09 09:23
  • 浩思動力首秀上海車展:多元動力技術驅動零碳出行新未來
    浩思動力首秀上海車展:多元動力技術驅動零碳出行新未來 4月24日,第二十一屆上海國際車展火熱進行中。全球動力總成領域的領軍企業浩思動力,以“多路徑共達零碳”為主題,亮相上海國家會展中心8.1館8A1......
    2025-05-09 09:15
  • 利氪科技驚艷上海車展:智能底盤2.0首發,全棧國產方案領航智駕新程
    利氪科技驚艷上海車展:智能底盤2.0首發,全棧國產方案領航智駕新程 4月23日,第二十一屆上海國際車展盛大啟幕。作為智能底盤系統領域的領先方案商,利氪科技亮相2.2H館,秉持“讓底盤思考,讓智駕進化......
    2025-05-09 08:55
欧美人与性动交α欧美精品|国产自产一线在线视频|晚上你懂在线一区二区|久久狠狠中文字幕2020|亚洲中文字幕在线第二页