2月17日消息,毫末智行宣布自動(dòng)駕駛認(rèn)知大模型正式升級(jí)為DriveGPT,并將在2023年4月的HAOMO AI DAY上公布其最新重要進(jìn)展。
隨著ChatGPT火爆全網(wǎng),它所采用的Transformer大模型以及“人類反饋強(qiáng)化學(xué)習(xí)(RLHF)”技術(shù)再次引發(fā)行業(yè)關(guān)注。在自動(dòng)駕駛領(lǐng)域,毫末在國內(nèi)最早將Transformer大模型引入到數(shù)據(jù)智能體系MANA當(dāng)中。在2023年1月的HAOMO AI DAY上,毫末智行CEO顧維灝介紹,毫末推出的人駕自監(jiān)督認(rèn)知大模型就已借鑒了ChatGPT的實(shí)現(xiàn)思路,采用RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),通過引入真實(shí)人駕接管數(shù)據(jù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。
毫末的認(rèn)知決策算法經(jīng)歷了三個(gè)階段的進(jìn)化。第一階段是引入個(gè)別場(chǎng)景的端到端模仿學(xué)習(xí),直接擬合人駕行為。第二階段是通過認(rèn)知大模型,引入海量正常人駕數(shù)據(jù),通過Prompt的方式實(shí)現(xiàn)認(rèn)知決策的可控、可解釋。第三階段,也就是當(dāng)前階段,通過引入真實(shí)接管數(shù)據(jù),并且在大模型中開始嘗試使用RLHF算法,對(duì)人駕接管數(shù)據(jù)進(jìn)行學(xué)習(xí)。為此,毫末構(gòu)建了一個(gè)包含“舊策略、接管策略、人工label策略”的Pairwise排序模型?;谶@一排序模型,毫末構(gòu)建了自動(dòng)駕駛決策的獎(jiǎng)勵(lì)模型(reward model),從而在各種規(guī)劃場(chǎng)景情況下做出最優(yōu)的決策。通過這一大模型,在掉頭、環(huán)島等公認(rèn)的困難場(chǎng)景中,場(chǎng)景通過率提升30%以上。
2月17日,毫末智行將人駕自監(jiān)督認(rèn)知大模型正式升級(jí)為“DriveGPT”,這也是全球首個(gè)自動(dòng)駕駛認(rèn)知大模型。目前,毫末DriveGPT已完成模型搭建和第一階段數(shù)據(jù)的跑通,參數(shù)規(guī)??蓪?duì)標(biāo)GPT-2的水平。接下來,DriveGPT將持續(xù)引入大規(guī)模真實(shí)接管數(shù)據(jù),通過人駕數(shù)據(jù)反饋的強(qiáng)化學(xué)習(xí),來不斷提升測(cè)評(píng)效果,同時(shí)也將DriveGPT作為云端測(cè)評(píng)模型,用來評(píng)估車端小模型的駕駛效果。毫末DriveGPT最新重要進(jìn)展,將在2023年4月舉行的第八屆HAOMO AI DAY上公布。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 傳音手機(jī)要狠補(bǔ)AI這把刀
- AI,讓產(chǎn)業(yè)互聯(lián)網(wǎng)成真
- 殲10真可能打開東南亞市場(chǎng),央視都報(bào)道了,法國戰(zhàn)機(jī)瑟瑟發(fā)抖
- AI大戰(zhàn),谷歌仍未扳回一局
- 成為 “流量贏家”的庫迪 真的值得加盟嗎?
- 老外破防了!在美國只吃荔枝罐頭的他,竟在中國實(shí)現(xiàn)“鮮荔自由”:8元一斤敞開吃!
- “內(nèi)亂”之后的榮耀,新品發(fā)布提速,打響“重返前三”之戰(zhàn)
- 微信推出“問一問主持人”功能,知乎和百度知道慌不慌?
- 警惕重蹈日本AI的覆轍
- 技術(shù)深耕為矛,用戶共創(chuàng)為盾,追覓撕開掃地機(jī)紅海戰(zhàn)場(chǎng)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。