標(biāo)題:清華星動(dòng)紀(jì)元開(kāi)源首個(gè)AIGC機(jī)器人大模型引領(lǐng)AI新潮流
隨著人工智能技術(shù)的飛速發(fā)展,我們正處在一個(gè)前所未有的時(shí)代。清華星動(dòng)紀(jì)元開(kāi)源首個(gè)AIGC機(jī)器人大模型VPP入選ICML2025 Spotlight,無(wú)疑是這個(gè)領(lǐng)域的一大亮點(diǎn)。VPP的開(kāi)源,不僅為學(xué)術(shù)界和產(chǎn)業(yè)界提供了寶貴的資源,也為機(jī)器人技術(shù)的發(fā)展開(kāi)辟了新的道路。
首先,VPP的成功開(kāi)發(fā),得益于清華大學(xué)叉院的ISRLab和星動(dòng)紀(jì)元合作開(kāi)發(fā)的創(chuàng)新性思路。VPP利用了大量互聯(lián)網(wǎng)視頻數(shù)據(jù)進(jìn)行訓(xùn)練,直接學(xué)習(xí)人類(lèi)動(dòng)作,減輕了對(duì)于高質(zhì)量機(jī)器人真機(jī)數(shù)據(jù)的依賴(lài)。這種創(chuàng)新的做法,不僅降低了數(shù)據(jù)獲取的難度,也使得機(jī)器人的學(xué)習(xí)過(guò)程更加高效。
VPP模型的成功,也得益于其強(qiáng)大的泛化能力。它將視頻擴(kuò)散模型的泛化能力轉(zhuǎn)移到了通用機(jī)器人操作策略中,解決了diffusion推理速度的問(wèn)題,讓機(jī)器人實(shí)時(shí)進(jìn)行未來(lái)預(yù)測(cè)和動(dòng)作執(zhí)行。這種創(chuàng)新性的技術(shù),大大提升了機(jī)器人策略泛化性,使得機(jī)器人能夠更好地適應(yīng)不同的環(huán)境和任務(wù)。
更值得一提的是,VPP模型的成功,也離不開(kāi)其跨本體學(xué)習(xí)的優(yōu)勢(shì)。VPP能夠直接學(xué)習(xí)各種形態(tài)機(jī)器人的視頻數(shù)據(jù),不存在維度不同的問(wèn)題。這種跨本體學(xué)習(xí)的模式,不僅拓寬了機(jī)器人的學(xué)習(xí)范圍,也提高了機(jī)器人的泛化能力。
在基準(zhǔn)測(cè)試中,VPP也展現(xiàn)出了卓越的性能。在Calvin ABC-D基準(zhǔn)測(cè)試中,VPP實(shí)現(xiàn)了4.33的任務(wù)完成平均長(zhǎng)度,已經(jīng)接近任務(wù)的滿(mǎn)分5.0。相較于先前技術(shù),VPP實(shí)現(xiàn)了41.5%的提升。這樣的表現(xiàn),無(wú)疑證明了VPP的優(yōu)越性和先進(jìn)性。
而在真實(shí)世界的測(cè)試中,VPP模型也展現(xiàn)出了良好的多任務(wù)學(xué)習(xí)能力和泛化能力。在星動(dòng)紀(jì)元單臂+仿人五指靈巧手靈巧手XHAND平臺(tái),VPP能夠完成100+種復(fù)雜靈巧操作任務(wù),例如抓取、放置、堆疊、倒水、工具使用等,在雙臂人形機(jī)器人平臺(tái)能完成50+種復(fù)雜靈巧操作任務(wù)。這樣的能力,無(wú)疑讓人對(duì)未來(lái)的人形機(jī)器人應(yīng)用充滿(mǎn)了期待。
此外,VPP模型的預(yù)測(cè)視覺(jué)表示在一定程度上是可解釋的,這使得開(kāi)發(fā)者在不通過(guò)real-world測(cè)試情況下,能夠通過(guò)預(yù)測(cè)的視頻來(lái)提前發(fā)現(xiàn)失敗的場(chǎng)景和任務(wù),進(jìn)行針對(duì)性的調(diào)試和優(yōu)化。這種可解釋性的特點(diǎn),無(wú)疑增強(qiáng)了VPP的透明度和可控性,也為機(jī)器人的調(diào)試和優(yōu)化提供了新的可能。
總的來(lái)說(shuō),清華星動(dòng)紀(jì)元開(kāi)源首個(gè)AIGC機(jī)器人大模型VPP的成功,是人工智能領(lǐng)域的一次重大突破。它的開(kāi)源,不僅為學(xué)術(shù)界和產(chǎn)業(yè)界提供了寶貴的資源,也為機(jī)器人技術(shù)的發(fā)展開(kāi)辟了新的道路。我們期待著,VPP以及更多類(lèi)似的技術(shù),能夠引領(lǐng)人工智能的新潮流,推動(dòng)機(jī)器人技術(shù)的進(jìn)一步發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )