3月18日消息,今日,理想汽車發(fā)布下一代自動駕駛架構(gòu)MindVLA。
理想汽車 CEO 李想在微博表示,它將空間智能、語言智能和行為智能統(tǒng)一在一個模型里,讓自動駕駛擁有感知、思考和適應(yīng)環(huán)境的能力,是我們通往L4路上最重要的一步。
MindVLA能為自動駕駛賦予類似人類的駕駛能力,就像iPhone 4重新定義了手機(jī),MindVLA也將重新定義自動駕駛。
理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬表示:“MindVLA是機(jī)器人大模型,它成功整合了空間智能、語言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運(yùn)輸工具轉(zhuǎn)變?yōu)橘N心的專職司機(jī),它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w。”
據(jù)了解,MindVLA不是簡單地將端到端模型和VLM模型結(jié)合在一起,所有模塊都是全新設(shè)計。3D空間編碼器通過語言模型,和邏輯推理結(jié)合在一起后,給出合理的駕駛決策,并輸出一組Action Token(動作詞元),Action Token指的是對周圍環(huán)境和自車駕駛行為的編碼,并通過Diffusion(擴(kuò)散模型)進(jìn)一步優(yōu)化出最佳的駕駛軌跡,整個推理過程都要發(fā)生在車端,并且要做到實時運(yùn)行。
MindVLA將為用戶帶來全新的產(chǎn)品形態(tài)和產(chǎn)品體驗,有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機(jī)。
“聽得懂”是用戶可以通過語音指令改變車輛的路線和行為,例如用戶在陌生園區(qū)尋找超市,只需要通過理想同學(xué)對車輛說:“帶我去找超市”,車輛將在沒有導(dǎo)航信息的情況下,自主漫游找到目的地;車輛行駛過程中,用戶還可以跟理想同學(xué)說:“開太快了”“應(yīng)該走左邊這條路”等,MindVLA能夠理解并執(zhí)行這些指令。
“看得見”是指MindVLA具備強(qiáng)大的通識能力,不僅能夠認(rèn)識星巴克、肯德基等不同的商店招牌,當(dāng)用戶在陌生地點找不到車輛時,可以拍一張附近環(huán)境的照片發(fā)送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動找到用戶。
“找得到”意味著車輛可以自主地在地庫、園區(qū)和公共道路上漫游,其中典型應(yīng)用場景是用戶在商場地庫找不到車位時,可以跟車輛說:“去找個車位停好”,車輛就會利用強(qiáng)大的空間推理能力自主尋找車位,即便遇到死胡同,車輛也會自如地倒車,重新尋找合適的車位停下,整個過程不依賴地圖或?qū)Ш叫畔?,完全依賴MindVLA的空間理解和邏輯推理能力。
總結(jié)來說,對于用戶而言,有MindVLA賦能的車不再只是一個駕駛工具,而是一個能與用戶溝通、理解用戶意圖的智能體。
- 《黑神話:悟空》PS5國行版將于6月18日正式發(fā)售,建議零售價268元起
- 報告:2029年美國AI搜索廣告支出將達(dá)260億美元,占比13.6%
- 重塑內(nèi)生安全體系 實現(xiàn)AI時代安全突圍 ——2025北京網(wǎng)絡(luò)安全大會(BCS)開幕
- 門禁憑證技術(shù)進(jìn)化簡史:開啟更加安全和便利的未來
- Google I/O 大會:科技盛宴,引領(lǐng)未來創(chuàng)新潮流
- 馬蜂窩端午出行大數(shù)據(jù):短途周邊游是主流,非遺民俗關(guān)注度持續(xù)走高
- 微軟裁員6000人原因揭曉 AI沖擊首當(dāng)其沖
- 騰訊音樂2025Q1業(yè)績持續(xù)高質(zhì)量增長:在線音樂服務(wù)收入達(dá)58億元,同比增長15.9%
- 硅谷巨頭庭審?fù)抡嫜裕何磥?0年Meta、谷歌搜索、iPhone或成歷史
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。