人形機器人在迎來 GPT 時刻前 " 沿途下蛋 "
AI 一天,人間一年。不管是機器人,還是手機、電腦等硬件,都被 AI 重塑了一遍。AI 與機器人的合體產(chǎn)物——具身智能正在走進每個人的生活。
每個人都在等待具身智能的 GPT 時刻,可以想象一下具身智能 " 拎包入住 " 后的生活:家里有各種各樣的機器人,它們各司其職,把主人的生活照顧得面面俱到。有一個房間專門用來放大大的服務器,機器人產(chǎn)生的數(shù)據(jù)都在本地處理和存儲,數(shù)據(jù)不出域,保護主人的隱私。
在 11 月 1 日至 2 日舉行的機器人開發(fā)者生態(tài)全球性技術大會 ROSCon China2025 上,天工機器人、智元機器人、魔法原子、加速進化、縱深科技等 " 機器人天團 " 同臺競技。臺下觀點交鋒,在碰撞中還原了 2025 年人形機器人的希望與困惑:在具身智能的 GPT 時刻來臨之前,擁擠的機器人賽道到了艱難的 " 賽點 ",價格卷至底價,訂單從哪里來?面對數(shù)據(jù)和標準 " 雙缺 " 的境地,該走哪一條技術路徑?
年銷 2 萬臺,機器人價格卷至底價
去年,人形機器人全國銷量只有幾百臺。從行業(yè)預測來看,今年,銷量預估將達到 2 萬臺。即便量產(chǎn)剛剛開始,還沒有大規(guī)模上市銷售,但是人形機器人已經(jīng)卷入了價格戰(zhàn)。
"目前價格逼近原材料成本,導致很多創(chuàng)新企業(yè)負擔過重,沒有機會去拓展新的應用場景。" 古月居聯(lián)合創(chuàng)始人顧強認為,現(xiàn)在人形機器人的發(fā)展階段,相當于手機剛開始出現(xiàn)的形態(tài)——大哥大,當時售價動輒上萬元,大部分人買不起這樣時髦的產(chǎn)品。規(guī)模化后開始降價,即便會有賣得很貴的機器人,但也會出現(xiàn)可以進入千家萬戶的經(jīng)濟型機器人。
人形機器人身處黎明,在制造行業(yè),每 10000 名員工約擁有 400 臺機器人,整體滲透率只有 4% 左右。
深圳市機器人協(xié)會秘書長譚維佳表示,在規(guī)模效應沒有顯現(xiàn)之前,機器人進入每一個領域的二次開發(fā)和實施成本都特別高,如果高到?jīng)]有行業(yè)典型客戶愿意為此買單,機器人就不得不進入相對成熟的領域,從而陷入死卷價格的艱難階段。
" 很多機器人都在虧本擴展市場,幾乎已經(jīng)是底價,這不利于行業(yè)發(fā)展。人形機器人能為我們的生活帶來附加價值,比如情緒價值,這是無法用純硬件成本來衡量的。" 國家地方共建具身智能機器人創(chuàng)新中心關節(jié)負責人、天工機器人負責人劉益彰認為。
沿途下蛋,等待具身智能的 GPT 時刻
今年 7 月,全球首家機器人 6S 店在深圳市龍崗區(qū)落地,匯集了上百款機器人,不僅可租可售,還可進行個性化定制。8 月,在北京亦莊,機器人 4S 店 Robot Mall 開業(yè)了。站在這一 4000 多平方米的空間里,仿佛走進了科幻世界,這里集合了全國 40 多家廠商的 50 多款機器人,包括天工、宇樹、優(yōu)必選等,堪稱 " 具身智能天團 "。
"近期,機器人 4S 店會像汽車 4S 店一樣慢慢普及,在商場里逛街就能看到越來越多專門售賣機器人的店鋪。未來人形機器人很有可能比人類還要多。" 劉益彰表示。
" 在消費者關注買不買得起之前,會先考慮有沒有用。" 國家地方共建人形機器人創(chuàng)新中心感知與自主系統(tǒng)技術專家朱華章認為,人形機器人還在 " 散裝 " 階段,功夫機器人只會打功夫,后空翻機器人只會后空翻,疊衣服機器人只負責疊衣服,大語言模型被困在揚聲器內與人對話,機器人們還不能勝任 " 保姆 " 這類復雜工作,幫助人類處理繁重的工作。
一直以來,居家養(yǎng)老陪護被認為是人形機器人的殺手級場景,可能在 10 年以內會實現(xiàn)。
當下的機器人訂單在哪里?在劉益彰看來,目前最熱賣的機器人集中于科研、教育和二次開發(fā)等場景。接下來,最有可能規(guī)模應用的是巡檢導覽、工廠搬運等場景,特別是幫助人類完成危險的工作。
落地場景將直接影響機器人的形態(tài),回到行業(yè)的普遍問題:人形是不是必選項?
人形機器人來到人類的生存環(huán)境,可以拎包入住,我們不需要為它們搭建特定軌道或運動場景。比如,在室外巡檢時,雙足行走的機器人的地形通過能力更強,輪式底盤容易在沙石地面上打滑,也不能爬樓梯。
" 在具身智能的 GPT 時刻到來之前,也有‘沿途下蛋’創(chuàng)造商業(yè)價值的可能性。" 在深圳市機器人協(xié)會秘書長譚維佳看來,商業(yè)化落地需要產(chǎn)業(yè)鏈各方合力推動的,比如場景服務的系統(tǒng)集成商、場景所有方,才最了解這個場景的 know-how(技術訣竅),而不是靠機器人整機開發(fā)廠商把所有落地工作都做了。
路徑之爭,爆火的 VLA 困于數(shù)據(jù)與標準
人形機器人馬拉松、格斗賽,今年各地紛紛組織機器人大賽,倒地不起、現(xiàn)場噴霧降溫等故障頻出,暴露出負責控制的小腦和負責感知決策的大腦能力不足的問題。
如何讓人形機器人更強更聰明?
目前主要有兩條路徑之爭,一條是大量預采集數(shù)據(jù)訓練的 VLA(視覺—語言—動作)路線,另一條是小樣本高泛化的路徑。
"VLA 是基礎,是讓機器人動起來的第一步,但可能不能依靠它來解決所有的問題,未來會整合更多模態(tài)的信息。" 非夕科技創(chuàng)新業(yè)務技術負責人施豐鳴說道,就像一個只有視覺和規(guī)劃能力,但沒有觸覺或肌肉微調能力的人,在執(zhí)行任務的時候可能會把螺絲擰壞,把杯子捏壞,或推倒物體。也就是說,純靠 VLA,可能無法實現(xiàn)精細操作,泛化性有限。
VLA 是一條高度依賴數(shù)據(jù)的路線,現(xiàn)在全國各地正在建立機器人數(shù)采中心,大多靠真人來訓練機器人,所以這種數(shù)據(jù)采集方式需要投入大量成本,各家、各行業(yè)之間不愿意共享,甚至缺乏數(shù)據(jù)采集的標準。
地瓜機器人具身負責人何泳澔提到,VLA 的泛化能力與通用性有限,跟智能駕駛相比,機器人行業(yè)的數(shù)據(jù)規(guī)模較小,而且硬件構型百花齊放,沒有標準,一定程度上為數(shù)據(jù)的收集帶來很大困難。
機器人行業(yè)還處于標準制定期,各地正在積極解決數(shù)據(jù)不足和標準缺乏的問題。
在今年 9 月舉行的 2025 浦江創(chuàng)新論壇上," 浦江 X 具身智能標準化數(shù)據(jù)集平臺(穹頂 -DOME)" 正式落地,實現(xiàn)了數(shù)據(jù)采集、治理、訓練、驗證的全鏈路閉環(huán),率先完成多模態(tài)數(shù)據(jù)的標準化生產(chǎn)、可信治理與高效流通,提供統(tǒng)一接口與質量基準,為產(chǎn)業(yè)鏈上下游提供統(tǒng)一的數(shù)據(jù)語言,為全球產(chǎn)業(yè)破解 " 技術突破與產(chǎn)業(yè)落地脫節(jié) " 難題提供了上海方案。
劉益彰所在的北京國地中心正在牽頭制定機器人的工藝流程、測試標準、性能標準與關鍵模組接口標準等。
譚維佳也提到,深圳作為全球硬件之都,將基于產(chǎn)業(yè)鏈彈性優(yōu)勢,形成硬件開發(fā)和制造的范式,幫助全球開發(fā)者驗證并落地。
最后回到終極問題,當人形機器人真正進入我們的生活,它會不會擠壓人類的生存空間?
"新的時代應該接納先進的生產(chǎn)工具。AI 和機器人淘汰的不是人類,而是不會用 AI、不會操控機器人的人類。" 朱華章樂觀地展望道。
來源:IT時報
