客戶(hù)端下載

          logo

          當(dāng)前位置:首頁(yè) > 資訊 > 資訊詳情

          讓AI化身專(zhuān)業(yè)“老司機(jī)”,理想汽車(chē)推出“VLA 司機(jī)大模型”

          揚(yáng)子汽車(chē)yhy | 05-09

          10618

          5月7日,理想汽車(chē)推出“理想AI Talk第二季——理想VLA司機(jī)大模型,從動(dòng)物進(jìn)化到人類(lèi)”,理想汽車(chē)董事長(zhǎng)兼CEO李想重點(diǎn)分享了對(duì)于人工智能的最新思考,VLA司機(jī)大模型的作用、訓(xùn)練方法和挑戰(zhàn),以及對(duì)于創(chuàng)業(yè)和個(gè)人成長(zhǎng)的見(jiàn)解。

          李想將AI工具分為三個(gè)層級(jí),分別是信息工具、輔助工具和生產(chǎn)工具。

          李想表示:“判斷Agent(智能體)是否真正智能,關(guān)鍵在于它是否成為生產(chǎn)工具。只有當(dāng)人工智能變成生產(chǎn)工具,才是其真正爆發(fā)的時(shí)刻。就像人類(lèi)會(huì)雇傭司機(jī),人工智能技術(shù)最終也會(huì)承擔(dān)類(lèi)似職責(zé),成為真正的生產(chǎn)工具。”

          VLA的實(shí)現(xiàn)不是突變的過(guò)程,是進(jìn)化的過(guò)程

          目前的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA(視覺(jué)語(yǔ)言行動(dòng)模型)能夠讓AI真正成為司機(jī),成為交通領(lǐng)域的專(zhuān)業(yè)生產(chǎn)工具。對(duì)理想汽車(chē)而言,未來(lái)的VLA就是一個(gè)像人類(lèi)司機(jī)一樣工作的司機(jī)大模型”。

          VLA的實(shí)現(xiàn)不是一個(gè)突變的過(guò)程,是進(jìn)化的過(guò)程,經(jīng)歷了三個(gè)階段,對(duì)應(yīng)理想汽車(chē)輔助駕駛的昨天、今天和明天。第一階段,理想汽車(chē)自2021年起自研依賴(lài)規(guī)則算法和高精地圖的輔助駕駛,類(lèi)似“昆蟲(chóng)動(dòng)物智能”。第二階段,理想汽車(chē)自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,視覺(jué)語(yǔ)言模型)輔助駕駛,接近“哺乳動(dòng)物智能”。

          端到端模型在處理復(fù)雜問(wèn)題時(shí)存在局限,雖可借助VLM視覺(jué)語(yǔ)言模型輔助,但VLM使用開(kāi)源模型,使其在交通領(lǐng)域的能力有限。同時(shí)端到端模型也難以與人類(lèi)溝通。為了解決這些問(wèn)題并提升用戶(hù)的智能體驗(yàn),理想汽車(chē)自2024年起開(kāi)展VLA研究,并在多項(xiàng)頂級(jí)學(xué)術(shù)會(huì)議上發(fā)表論文,夯實(shí)了理論基礎(chǔ)。

          在端到端的基礎(chǔ)上,到第三階段,VLA將開(kāi)啟“人類(lèi)智能”的階段。它能通過(guò)3D和2D視覺(jué)的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時(shí),VLA擁有完整的腦系統(tǒng),具備語(yǔ)言、CoT(思維鏈)推理能力,既能看,也能理解并真正執(zhí)行行動(dòng),符合人類(lèi)的運(yùn)作方式。

          VLA司機(jī)大模型以“司機(jī)Agent(智能體)”的產(chǎn)品形態(tài)呈現(xiàn),用戶(hù)可通過(guò)自然語(yǔ)言與司機(jī)Agent溝通,跟人類(lèi)司機(jī)怎么說(shuō),就跟司機(jī)Agent怎么說(shuō)。簡(jiǎn)單通用的短指令由端側(cè)的VLA直接處理,復(fù)雜指令則先由云端的VL基座模型解析,再交由VLA處理。

          超級(jí)對(duì)齊確保AI決策安全,世界模型破解AI黑盒難題

          除了提升專(zhuān)業(yè)能力,VLA司機(jī)大模型還需解決安全性和模型黑盒的問(wèn)題。

          模型能力越強(qiáng),越需要職業(yè)性約束,以確保能力下限。為了保障VLA司機(jī)大模型能夠?qū)崿F(xiàn)職業(yè)司機(jī)般的安全和舒適,避免學(xué)習(xí)加塞等違規(guī)行為,理想汽車(chē)在強(qiáng)化訓(xùn)練環(huán)節(jié)投入大量資源,并于2024年底組建超過(guò)100人的超級(jí)對(duì)齊團(tuán)隊(duì),相當(dāng)于為司機(jī)Agent注入職業(yè)素養(yǎng)。

          為解決模型的黑盒問(wèn)題,理想汽車(chē)結(jié)合重建和生成兩種路徑,打造了真實(shí)、符合物理世界規(guī)律的世界模型,覆蓋所有交通參與者和要素。基于世界模型的仿真能力,VLA可以在世界模型中低成本、準(zhǔn)確地驗(yàn)證現(xiàn)實(shí)問(wèn)題,提升解決問(wèn)題的效率,有效應(yīng)對(duì)模型黑盒帶來(lái)的挑戰(zhàn)。

          VLA司機(jī)大模型提升了專(zhuān)業(yè)能力,超級(jí)對(duì)齊增強(qiáng)了職業(yè)能力,VLA通過(guò)理解自然語(yǔ)言、具備記憶能力提升了構(gòu)建信任的能力。

          人工智能時(shí)代,扎實(shí)的基本功比走捷徑重要

          理想汽車(chē)堅(jiān)持自研,通過(guò)技術(shù)賦能用戶(hù)價(jià)值。例如,在輔助駕駛方面,由于英偉達(dá)Orin-X芯片無(wú)法直接運(yùn)行語(yǔ)言模型,端到端+VLM的輔助駕駛方案對(duì)部分企業(yè)來(lái)說(shuō)仍具挑戰(zhàn)。理想汽車(chē)依托自有編譯團(tuán)隊(duì),自研底層推理引擎,使芯片可通過(guò)INT4(4比特整型)量化的方式運(yùn)行VLM。同時(shí),憑借芯片、控制器設(shè)計(jì)和自研汽車(chē)操作系統(tǒng)等綜合能力,理想汽車(chē)實(shí)現(xiàn)了讓雙Orin-X芯片和Thor-U芯片運(yùn)行同等規(guī)模的VLA司機(jī)大模型。李想表示,大型企業(yè)的基本功和能力永遠(yuǎn)無(wú)法被逾越。

          得益于DeepSeek的開(kāi)源,理想汽車(chē)在VLA司機(jī)大模型的語(yǔ)言能力研發(fā)上提速顯著,節(jié)省了近9個(gè)月的時(shí)間和數(shù)億元成本。盡管如此,理想汽車(chē)仍選擇加大投入,在基座模型上投入超預(yù)期3倍的訓(xùn)練卡,專(zhuān)注打造適配多場(chǎng)景的自研模型。

          十周年將至,持續(xù)為行業(yè)和用戶(hù)創(chuàng)造價(jià)值

          今年7月,理想汽車(chē)將迎來(lái)成立十周年。李想表示,“創(chuàng)業(yè)確實(shí)不容易,但是沒(méi)必要苦哈哈的。苦和甜是一個(gè)硬幣的正反面,取決于看哪一面。”也正因這份積極樂(lè)觀的創(chuàng)業(yè)心態(tài),理想汽車(chē)才能快速成長(zhǎng)為千億營(yíng)收規(guī)模、百萬(wàn)交付量的新勢(shì)力企業(yè)。

          面對(duì)AI的發(fā)展,李想認(rèn)為,在AI面前所有的人性都應(yīng)被保留,無(wú)論好壞,因?yàn)橐磺腥诵远际俏幕⑸⑿愿瘛⒛芰Φ奶刭|(zhì),也是人類(lèi)真正的生命力所在。

          從使用增程電動(dòng)和5C超充技術(shù)解決電池成本高、充電難、充電慢的問(wèn)題,到自研汽車(chē)操作系統(tǒng)攻克傳統(tǒng)汽車(chē)操作系統(tǒng)性能差、開(kāi)發(fā)緩慢、芯片匹配周期長(zhǎng)等挑戰(zhàn),理想汽車(chē)始終以技術(shù)創(chuàng)新解決行業(yè)無(wú)法解決的問(wèn)題。自研VLA時(shí),理想汽車(chē)更是踏入了人工智能的無(wú)人區(qū)。當(dāng)前,輔助駕駛走到了新的十字路口上,理想汽車(chē)將不斷挑戰(zhàn)成長(zhǎng)的極限,持續(xù)為行業(yè)和用戶(hù)創(chuàng)造價(jià)值。

          水滴汽車(chē)公眾號(hào)
          掃碼關(guān)注,獲取更多汽車(chē)資訊
          水滴汽車(chē)
          掃碼下載水滴汽車(chē)APP

          熱門(mén)評(píng)論(0)

          加載更多

          熱門(mén)車(chē)系資訊

          更多 >

          D7 DMH

          12.58-14.58萬(wàn)元

          雅閣

          17.98-25.98萬(wàn)元

          奧迪 e-tron

          54.68-64.88萬(wàn)元

          杰德

          12.99-18.38萬(wàn)元

          思域

          11.99-16.99萬(wàn)元

          1. 北京水滴交互網(wǎng)絡(luò)科技有限公司

          Copyright @ 水滴汽車(chē) 京ICP備17030485號(hào)-2 京公網(wǎng)備 11010102003639號(hào)