12月10日消息,理想在今年8月份的高管世界機(jī)器人大會(huì)(WRC)上,宇樹科技創(chuàng)始人王興興質(zhì)疑VLA(視覺語(yǔ)言動(dòng)作模型)的宇樹疑一番言論,引起業(yè)界熱議。王興
王興興稱,興質(zhì)型方對(duì)于當(dāng)前機(jī)器人大火的自動(dòng)最好VLA路線,他持有一定的駕駛懷疑態(tài)度,并直言稱“這是理想一個(gè)相對(duì)傻瓜式的架構(gòu)”。
原因是高管當(dāng)VLA模型與真實(shí)世界交互的時(shí)候,背后的宇樹疑數(shù)據(jù)質(zhì)量、數(shù)量,王興并不太夠用。興質(zhì)型方
而今日,自動(dòng)最好理想汽車自動(dòng)駕駛研發(fā)高級(jí)副總裁@ 郎咸朋在微博發(fā)長(zhǎng)文,駕駛回應(yīng)了此事。理想
郎咸朋表示,當(dāng)時(shí)沒有提出我的觀點(diǎn),一是理想VLA司機(jī)大模型還沒正式發(fā)布,空口無憑;二是我們對(duì)具身機(jī)器人行業(yè),還處于密切關(guān)注階段。
我跟王興興觀點(diǎn)最不一樣的地方在于,他認(rèn)為模型架構(gòu)更重要,但我認(rèn)為模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配,在此基礎(chǔ)上,數(shù)據(jù)是起決定意義的。
從今年9月VLA正式發(fā)布,到12月6日OTA 8.1的推送,經(jīng)過兩個(gè)月多的“實(shí)踐出真知”后,我有兩點(diǎn)心得:第一,VLA就是自動(dòng)駕駛最好的模型方案,第二,具身智能最終拼的是整體的系統(tǒng)能力。
郎咸朋稱,理想的VLA本質(zhì)上就是生成式模型,是在用 GPT 的方式做自動(dòng)駕駛,只不過生成的Token不是文本,而是軌跡和控制信號(hào)。
從目前用戶使用的反饋看,在某些場(chǎng)景下理想的VLA已經(jīng)具備了對(duì)物理世界的認(rèn)知涌現(xiàn)。具體表現(xiàn)是用戶會(huì)越來越多的發(fā)現(xiàn)之前端到端沒有的擬人行為。
并且,世界模型更適合做“考場(chǎng)”而不是“考生”,在自動(dòng)駕駛領(lǐng)域,脫離了海量真實(shí)數(shù)據(jù)談模型架構(gòu)都是空中樓閣,我們之所以堅(jiān)持 VLA,是因?yàn)槲覀儞碛袛?shù)百萬輛車構(gòu)建的數(shù)據(jù)閉環(huán),這讓我們能在當(dāng)前算力下,把駕駛水平做到接近人類。
針對(duì)具身智能方面,要想做好自動(dòng)駕駛,必須先把自動(dòng)駕駛當(dāng)作完整的具身智能系統(tǒng)對(duì)待,每一部分在研發(fā)過程中要相互配合才能將價(jià)值發(fā)揮出來。理想的自動(dòng)駕駛團(tuán)隊(duì)與基座模型、芯片、底盤團(tuán)隊(duì)協(xié)同打造了整個(gè)的自動(dòng)駕駛系統(tǒng)。
同時(shí),模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配,在此基礎(chǔ)上,數(shù)據(jù)是起決定意義的。在機(jī)器人領(lǐng)域獲取數(shù)據(jù)相對(duì)困難,但在自動(dòng)駕駛領(lǐng)域,特別是建立起數(shù)據(jù)閉環(huán)能力的車企來說并不是大問題。
理想不僅可以從過去幾年積累的10幾億公里的存量數(shù)據(jù)里進(jìn)行挖掘和篩選,更可以通過150萬車主的日常使用源源不斷的獲取新的數(shù)據(jù)。
此外,李想前兩天明確提到,未來五到十年,具身機(jī)器人核心將有兩種形態(tài):汽車類的具身機(jī)器人、人形類的具身機(jī)器人。
理想的VLA不僅服務(wù)于現(xiàn)在的理想各類汽車產(chǎn)品形態(tài),也將服務(wù)于未來的汽車類具身機(jī)器人。


相關(guān)文章




精彩導(dǎo)讀
熱門資訊
關(guān)注我們