深圳的深圳速度一家初創(chuàng)公司,成立不到一年半融資超20億,端到端踐背后是行玩阿里、美團(tuán)等巨頭的家自機(jī)器機(jī)器進(jìn)千家萬重注押碼,以及一個(gè)清華學(xué)霸的變量機(jī)器人夢想。
2025年深圳國際人工智能展覽會上,人讓人走一臺名為“小量”的通用機(jī)器人正在熟練地制作果味冰沙。從取杯、深圳速度接冰到添加小料,端到端踐所有動(dòng)作一氣呵成,行玩僅用兩分鐘便完成了一份晶瑩剔透的家自機(jī)器機(jī)器進(jìn)千家萬冰沙。這場展示吸引了大量圍觀者,變量但更引人注目的人讓人走是。
這臺機(jī)器人背后的通用公司——自變量機(jī)器人,成立不到一年半已完成7輪融資,深圳速度累計(jì)融資金額超過20億元人民幣,成為國內(nèi)具身智能賽道最受資本青睞的創(chuàng)業(yè)公司之一。
在自變量機(jī)器人創(chuàng)始人兼CEO王潛的規(guī)劃中,制作冰沙只是起點(diǎn),他的終極目標(biāo)是“讓通用機(jī)器人真正走入千家萬戶”。
01 信仰
王潛身上有著典型清華學(xué)子的特質(zhì)——理性、執(zhí)著且富有遠(yuǎn)見。他本碩畢業(yè)于清華大學(xué),是全球最早在神經(jīng)網(wǎng)絡(luò)中引入注意力機(jī)制的學(xué)者之一,與Google在該領(lǐng)域的首篇文章發(fā)表在同一會議。
這一貢獻(xiàn)后來成為Transformer架構(gòu)的關(guān)鍵,奠定了現(xiàn)代大模型的技術(shù)基礎(chǔ)。
在美國南加州大學(xué)攻讀博士期間,王潛選擇了熱愛的機(jī)器人領(lǐng)域,在美國頂級機(jī)器人實(shí)驗(yàn)室參與了多項(xiàng)機(jī)器人學(xué)習(xí)和人機(jī)交互的研究。這段經(jīng)歷讓他對機(jī)器人技術(shù)有了更深刻的理解,也讓他意識到傳統(tǒng)機(jī)器人技術(shù)的局限性。
博士畢業(yè)后,王潛曾在美國創(chuàng)立量化基金公司,可“晚上經(jīng)常睡不著想做機(jī)器人”。對機(jī)器人技術(shù)的執(zhí)著始終縈繞在他心頭。2023年,隨著大語言模型等相關(guān)領(lǐng)域取得突破性進(jìn)展,王潛敏銳地捕捉到機(jī)器人行業(yè)的新契機(jī)。
他毅然決定解散基金,回國創(chuàng)業(yè)。
王潛選擇回國創(chuàng)業(yè)并非一時(shí)沖動(dòng)。在他看來,中國在硬件制造和供應(yīng)鏈方面具有全球領(lǐng)先的優(yōu)勢。“美國硬件人才大都被‘金手銬’拷進(jìn)了大公司”,而“中國的供應(yīng)鏈優(yōu)勢可能領(lǐng)先了美國一個(gè)數(shù)量級”。
他特別指出,數(shù)據(jù)收集工作的成本在中國基本上是美國的1/10。
2023年12月18日,王潛第一次來到深圳,自變量機(jī)器人正式成立。深圳的產(chǎn)業(yè)鏈生態(tài)讓他印象深刻:“當(dāng)時(shí),我們實(shí)驗(yàn)室里用的機(jī)器人硬件,包括零配件等等,很多都是深圳產(chǎn)的。
”他補(bǔ)充道,“在深圳,兩天甚至半天就能配齊所有零部件”。
02 堅(jiān)守
自變量機(jī)器人從成立之初就選擇了一條與眾不同的技術(shù)路徑——“大小腦統(tǒng)一的端到端大模型”路線。這一選擇在當(dāng)時(shí)顯得頗為孤傲,甚至遭到了業(yè)內(nèi)專家的質(zhì)疑。
幾年前,王潛提出端到端思路的時(shí)候,一位有名的機(jī)器人教授曾當(dāng)面否定了他的設(shè)想:“端到端很有意思,但可能永遠(yuǎn)只是個(gè)玩具,不會落地。”
什么是端到端模型? 與傳統(tǒng)的分層架構(gòu)不同,端到端模型試圖在統(tǒng)一架構(gòu)中解決從感知、規(guī)劃到控制的全流程問題。傳統(tǒng)分層架構(gòu)將任務(wù)分解為感知、規(guī)劃、控制等多個(gè)模塊,每個(gè)模塊有獨(dú)立模型,而端到端模型則是單一的、整合的模型。
王潛解釋道,“分層模型每多一步拆解,就會引入額外誤差和不可控的噪聲,難以實(shí)現(xiàn)真正可靠地執(zhí)行;而端到端統(tǒng)一模型,能夠在‘感知—決策—執(zhí)行’的全流程中保持連續(xù)性,從根本上解決這一問題。”
自變量機(jī)器人的技術(shù)理念可以概括為“縱向統(tǒng)一”和“橫向統(tǒng)一”。縱向統(tǒng)一指從視頻、傳感器等原始輸入到機(jī)器人運(yùn)動(dòng)輸出,全部由同一模型處理;橫向統(tǒng)一則是不同任務(wù)共用同一個(gè)模型,訓(xùn)練和推理都在同一架構(gòu)下完成。
這一技術(shù)路線的優(yōu)勢在WALL-A模型上得到了充分體現(xiàn)。該模型使機(jī)器人僅用二指夾爪就能完成拉拉鏈、疊衣服、澆花等復(fù)雜操作,數(shù)分鐘級別的任務(wù)成功率達(dá)到了95%以上。
03 進(jìn)化
自變量機(jī)器人的產(chǎn)品演化路徑清晰地反映了其技術(shù)路線的正確性。成立僅兩個(gè)月,公司就成功訓(xùn)練出第一版具身智能操作模型,能夠?qū)崿F(xiàn)切菜、倒水等復(fù)雜的操作任務(wù)。
2024年底,自變量機(jī)器人發(fā)布了全球目前最大參數(shù)規(guī)模的具身智能通用操作大模型——Great Wall系列(GW)的WALL-A模型。
WALL-A模型展現(xiàn)出三大技術(shù)突破:
首先,它實(shí)現(xiàn)了多模態(tài)信息融合,可以整合不同類型的感知數(shù)據(jù)、自然語言指令與運(yùn)動(dòng)控制信號,實(shí)現(xiàn)輸入到輸出的端到端映射。
其次,該模型具備零樣本泛化能力,即在部分未見過的新任務(wù)場景中無需重新訓(xùn)練就能適應(yīng)。這是實(shí)現(xiàn)通用機(jī)器人的關(guān)鍵標(biāo)志之一。
第三,模型在動(dòng)態(tài)環(huán)境感知、實(shí)時(shí)任務(wù)規(guī)劃和超長程任務(wù)方面取得顯著進(jìn)展。例如,機(jī)器人可以處理拉上散開衣服的拉鏈或扣扣子、然后掛起來這樣的復(fù)雜長序列任務(wù)。
光速光合合伙人朱嘉在參觀自變量機(jī)器人DEMO時(shí),特意做了突擊測試:他在公司附近的超市買了十幾個(gè)樣式各異的玻璃瓶、馬克杯甚至燒水壺,現(xiàn)場測試機(jī)器人的抓取能力。
“有些形狀的杯子它從來沒見過,雖然抓得很踉蹌,但最終還是成功了。”
04 選擇
在數(shù)據(jù)策略上,自變量機(jī)器人堅(jiān)持“高質(zhì)量真機(jī)數(shù)據(jù)”的路線,這與許多依賴仿真數(shù)據(jù)或互聯(lián)網(wǎng)視頻數(shù)據(jù)的同行形成鮮明對比。
王潛明確表示:“所有涉及到復(fù)雜物理交互(如接觸豐富的手部操作)完全不使用仿真數(shù)據(jù)。我們在這個(gè)方面探索了十幾年,基本結(jié)論是,手部復(fù)雜操作無法通過仿真數(shù)據(jù)來進(jìn)化。”
自變量的數(shù)據(jù)收集主要來自三個(gè)渠道:集中式數(shù)據(jù)采集場地、分布式現(xiàn)實(shí)環(huán)境收集,以及機(jī)器人部署后的回流數(shù)據(jù)。這種多渠道、高質(zhì)量的數(shù)據(jù)收集策略,為模型訓(xùn)練提供了堅(jiān)實(shí)保障。
王潛將泛化能力劃分為四個(gè)層次:基礎(chǔ)條件的泛化(適應(yīng)光照、物體位置等變化)、跨環(huán)境的泛化(從一個(gè)場景擴(kuò)展到不同場景)、對象層面的泛化(對同類但未見過的全新物體依然能完成任務(wù)),以及任務(wù)的泛化(對完全未學(xué)習(xí)過的任務(wù)具備探索和解決的能力)。
他透露,目前自變量的模型在前三個(gè)層面都體現(xiàn)出了很好的通用性、泛化性能力。
05 野心
自變量機(jī)器人在資本市場的表現(xiàn)令人矚目。自成立起不到一年半時(shí)間內(nèi),公司已完成7輪融資,累計(jì)融資金額超過20億元。
2025年9月,自變量機(jī)器人宣布完成近10億元A+輪融資,阿里云、國科投資領(lǐng)投,國開金融、紅杉中國、渶策資本跟投,老股東美團(tuán)、聯(lián)想之星、君聯(lián)資本追投。這是阿里云首次投資具身智能公司,也是美團(tuán)第二次參與自變量機(jī)器人的融資。
三大電商巨頭在具身智能領(lǐng)域的布局邏輯存在明顯差異:
阿里投資的具身智能公司數(shù)量最多,已投了10家。其邏輯并不僅限于業(yè)務(wù)場景,而是更希望通過云計(jì)算和大模型擴(kuò)展人工智能的應(yīng)用邊界,構(gòu)建具身智能技術(shù)生態(tài)。
美團(tuán)雖然投資數(shù)量不及阿里,但對機(jī)器人的布局更早、更廣。從未來機(jī)器人、非夕、普渡科技等物流、協(xié)作、室內(nèi)配送方向的機(jī)器人本體企業(yè),到智譜AI、光年之外、月之暗面等大模型和AI芯片公司,美團(tuán)幾乎在機(jī)器人相關(guān)的上下游都有布局。
京東今年才開始投資具身智能,但節(jié)奏很快,4個(gè)月內(nèi)就投了6家具身公司。與阿里類似,京東也希望打造具身智能技術(shù)生態(tài),但更強(qiáng)調(diào)場景導(dǎo)向,重點(diǎn)聚焦零售、物流、家庭三大垂直應(yīng)用。
一位雙幣機(jī)構(gòu)投資人指出,從融資金額看,目前國內(nèi)人形機(jī)器人創(chuàng)業(yè)公司已經(jīng)形成了鮮明的梯隊(duì)。第一梯隊(duì)的公司有三家:宇樹科技、智元機(jī)器人和銀河通用,融資金額都在15億元以上。
自變量機(jī)器人融資金額超過10億元,已從二線企業(yè)進(jìn)入準(zhǔn)一線之列。
06 路徑
面對商業(yè)化這一具身智能領(lǐng)域最受質(zhì)疑的問題,王潛有著清晰的規(guī)劃。他認(rèn)為,“家庭是機(jī)器人最大市場,預(yù)計(jì)3-4年會出現(xiàn)早期產(chǎn)品”。
經(jīng)濟(jì)學(xué)有過測算,人類家務(wù)勞動(dòng)未計(jì)入GDP,但占比高達(dá)四分之一,因此家庭機(jī)器人市場潛力巨大,甚至可能比工業(yè)場景,以及所有其他場景都要更大。
自變量的商業(yè)化路徑是從To B場景切入,逐步延展至To C。王潛指出,公司今年將在多個(gè)功能性場景中做商業(yè)化落地,讓機(jī)器人在開放性、隨機(jī)性場景里自主完成各種復(fù)雜的操作。
對于目前行業(yè)中部分企業(yè)將人形機(jī)器人送入工廠從事簡單重復(fù)性工作的做法,王潛直言“那其實(shí)就是一個(gè)PR(公關(guān))行為”。在他看來,要實(shí)現(xiàn)真正有價(jià)值的商業(yè)化,必須要依靠具身智能模型的泛化能力提升。
在價(jià)格方面,王潛預(yù)測,消費(fèi)者能接受、產(chǎn)業(yè)鏈能夠提供的一個(gè)價(jià)格可能在1-2萬美元之間,也就是10萬元上下。但他坦言,現(xiàn)在大家還是做不到這一點(diǎn),這需要產(chǎn)業(yè)鏈成本進(jìn)一步優(yōu)化。
王潛預(yù)計(jì),類GPT-3水平的具身智能大模型有望在一年左右出現(xiàn)。而人形機(jī)器人的“ChatGPT時(shí)刻”則需要3-5年時(shí)間周期,才會達(dá)到類似ChatGPT的水平。
07 未來
盡管自變量機(jī)器人取得了顯著進(jìn)展,但王潛清醒地認(rèn)識到,通往通用機(jī)器人的道路上仍充滿挑戰(zhàn)。他認(rèn)為,現(xiàn)階段限制機(jī)器人產(chǎn)業(yè)化應(yīng)用的主要因素是機(jī)器人的“大腦”,而非硬件。
“大家在展館中看到了大量運(yùn)動(dòng)能力做得很不錯(cuò)的機(jī)器人,但與此同時(shí),他們能夠提供的‘實(shí)用價(jià)值’有限,更多提供的還是‘形式價(jià)值’。”
數(shù)據(jù)隱私和安全性問題也是具身智能發(fā)展過程中必須面對的挑戰(zhàn)。隨著具身智能從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用,通過傳感器(攝像頭、麥克風(fēng))持續(xù)收集環(huán)境數(shù)據(jù)(如家庭布局、人臉圖像、對話內(nèi)容)可能侵犯隱私。
面對這些挑戰(zhàn),自變量機(jī)器人正在積極構(gòu)建具身智能生態(tài)系統(tǒng)。2025年9月,公司在合肥發(fā)布了《具身智能生態(tài)建設(shè)計(jì)劃》,通過引入自研具身基礎(chǔ)模型,打造全球具身智能創(chuàng)新與產(chǎn)業(yè)的核心樞紐。
同時(shí),公司還開源了自研端到端具身智能基礎(chǔ)模型WALL-OSS,這是唯一一個(gè)面向物理世界交互、具備真正落地能力的開源端到端具身智能基礎(chǔ)模型。
對于長遠(yuǎn)發(fā)展,王潛認(rèn)為機(jī)器人會采用軟硬一體的商業(yè)模式。“機(jī)器人相對特殊,無法形成像Windows或Android這樣的商業(yè)模式,機(jī)器人需軟硬件高度耦合,軟硬一體是最合理的商業(yè)模式。”
2025年世界機(jī)器人大會上,搭載自變量WALL-A模型的“量子2號”機(jī)器人自如地完成制作香囊、整理客廳等復(fù)雜任務(wù),引來眾多圍觀。
王潛站在展臺旁冷靜觀察,臉上沒有太多表情。于他而言,展臺上的喝彩只是過程,真正的征程遠(yuǎn)未結(jié)束。
那個(gè)讓通用機(jī)器人走進(jìn)千家萬戶的夢想,正在以“深圳速度”一步步變?yōu)楝F(xiàn)實(shí)。


相關(guān)文章




精彩導(dǎo)讀
熱門資訊
關(guān)注我們