過去十幾年,科技圈最不缺的就是“風(fēng)口”。
VR眼鏡、虛擬貨幣區(qū)塊鏈、元宇宙,這些概念哪個曾經(jīng)不是看著前途無量,到最后卻都“啞火”了。
于是,今年來具身智能的突然爆火,很多人第一反應(yīng)是:又來?
01
具身智能,“前輩”很多
具身智能確實和很多“前輩”一樣,具備了很多風(fēng)口的特征。
為什么呢?
除了“春晚機器人跳舞”這件讓家喻戶曉的標志性事件之外,還有一個很有代表性意義的是,就在今年,它首次被寫入《政府工作報告》:“建立未來產(chǎn)業(yè)投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)?!?/span>
具身智能,事實上已成為我國培育未來產(chǎn)業(yè)的重要方向,也變成了全球科技競合的“關(guān)鍵領(lǐng)域”。
僅2025上半年,資本就砸了200多個億,有130多起融資事件,OpenAI、英偉達、谷歌、華為、阿里……科技巨頭全員下場搶占這塊“熱蛋糕”。
很多人開始唱衰。
比如金沙江創(chuàng)投的創(chuàng)始人朱嘯虎,直接喊出具身智能商業(yè)路徑不清,批量退出了投資的人形機器人公司,獵豹移動的CEO傅盛也堅定地認為人形機器人落地太難、應(yīng)用太遠,至少五年,甚至更長時間都無法落地。
就連國際投行都關(guān)注到了宇樹科技,在春節(jié)過后的2月27日對這家公司進行調(diào)研之后,發(fā)布報告稱,人形機器人距離真正投入生產(chǎn)和日常使用仍有漫長的路要走,市場對這項技術(shù)的期待可能過于超前。
看起來,又可能會重蹈前輩們的覆轍,像虛擬貨幣、區(qū)塊鏈、AR眼鏡、無人駕駛、元宇宙等概念一樣,兌現(xiàn)起來遙遙無期。
02
技術(shù)與成本雙重絞殺
經(jīng)濟價值卻難以兌現(xiàn)
這種擔(dān)憂,并無道理。
首先,技術(shù)上面臨算力、電池容量、腦力與體力的平衡等諸多瓶頸。
具身智能這個概念早在1950年就被提出了,無論是半導(dǎo)體的發(fā)展還是編程技術(shù)的進步,相關(guān)的創(chuàng)業(yè)公司始終沒有拿出什么可堪一用的作品。
直到工業(yè)4.0之類的概念出現(xiàn)之后,相關(guān)產(chǎn)業(yè)鏈才有了一定發(fā)展。但就算是在Isaac Gym里,99%成功率的算法,落地到研發(fā)出來的真實機械臂,任務(wù)成功率也可能降到30%,國內(nèi)外具身智能的AI泛化能力都表現(xiàn)出明顯的不足,在非預(yù)設(shè)場景(如家庭雜亂環(huán)境)中任務(wù)失敗率普遍在10%以上。
直到工業(yè)4.0之類的概念出現(xiàn)之后,相關(guān)產(chǎn)業(yè)鏈才有了一定發(fā)展。
但大部分,也都集中在固定式機器人、輪式機器人、四足機器人、履帶機器人等領(lǐng)域,能履行的工作簡單且單一。
直到人工智能的出現(xiàn)。
人工智能的表面是算法,核心是算力,大模型則是將之糅合的升級形態(tài),可以說未來具備更多思考能力的具身智能,一定是大模型催動的。
但是,這又會面臨一些新情況——機器人的“腦容量”太小了,要在機器人的“大腦”中安裝千億參數(shù)的多模態(tài)大模型,并非易事。
由于機器人的工作場景復(fù)雜且多變,幾乎排除了“云服務(wù)”這個高延遲且不穩(wěn)定的選項,所以機器人還要考慮電池技術(shù)本身的瓶頸,當(dāng)本體自帶電池容量有限的情況下,如何在高耗電和高“腦力”之間形成一個平衡好?這個問題,人類用數(shù)十上百萬年的進化才給出了一個最佳平衡,但給機器人進化的時間顯然不會太久。
其次,具身機器人的成本居高不下,資本與現(xiàn)金流陷入雙重博弈。
以行業(yè)先驅(qū)“波士頓動力”為例,其在四足機器人界橫掃千軍,卻在過去十年間三次易主,從谷歌到軟銀再到現(xiàn)代,每一次易主的理由都寫在財報赤字里:一臺Atlas實驗機成本200萬美元——相當(dāng)于北京三環(huán)一套學(xué)區(qū)房,卻只會在障礙賽上跑酷,連遞杯咖啡都怕它灑。
國內(nèi)的具身智能公司也感同身受。
智元機器人剛成立兩年就急著遞招股書,原因無他——現(xiàn)金流快見底了。2023年,智元機器人虧損了8.7億,賬上現(xiàn)金只夠再燒18個月,再不上市“補血”,就得把實驗室的機械臂掛上閑魚了。
同樣的,以服務(wù)機器人頭部企業(yè)云跡科技營收從2022年1.61億元增至2024年2.45億元,年復(fù)合增長率達23.2%,但同期虧損分別高達3.65億、2.64億和1.85億元。與具身智能極為貼近的移動機器人龍頭極智嘉虧損更大,2024年營收24.09億元,卻虧損8.32億元。其在招股書中坦言:“將業(yè)務(wù)擴展及創(chuàng)新放在首要的戰(zhàn)略位置,專注于長期價值創(chuàng)造,而非短期財務(wù)回報。”
撇開訓(xùn)練和人工成本先不談,僅僅是硬性開支就是一頭吞金怪獸。
比如硬件三大件——減速器、伺服電機、控制器——占整機成本六七成,精度每提高0.01毫米,預(yù)算就要再燒掉一個零。
算法也不便宜,華為云曾經(jīng)算過:要讓機器人跑通10億參數(shù)的大模型,得1萬張A100顯卡不眠不休干一個月,光電費就十分夸張。
然后,具身機器人的場景極為缺乏,無論工作價格還是靈活性,都難以和人類匹敵。
可能很多人,都幻想過科幻電影或游戲里的場景,機器人能夠像人類一樣思考和工作,但其實具身智能在一二十年甚至更久的時間,都難以滿足這種幻想。
目前,無論是任何一個做機器人的公司,幾乎從來不會在公開場合將之與人類對比。畢竟,在“打工”這件事上,具身機器人也是典型的“高不成、低不就”。
宇樹科技的G1機器人每一臺都需要手動調(diào)節(jié)關(guān)節(jié)電機,月產(chǎn)能只有300臺,波士頓動力的Atlas硬件毛利率只有18%,賣一臺能虧半臺,幾乎要把高科技做成了“慈善”。
智元機器人生產(chǎn)的機器人在工業(yè)場景占比70%,可一旦回到家庭客廳,將近10萬的標價立刻勸退所有想把它買回家的打工人——畢竟,同等預(yù)算能請真人保姆三年,還能面面俱到。
說到底,它們能干的活還太少,價格又太貴,卷服務(wù)質(zhì)量和價格卷不過人類,也不如AI大模型便捷易上手,可能有一個不太恰當(dāng)?shù)谋扔鳌?dāng)黑奴的使用成本遠低于機器的時候,南方的農(nóng)場主不會擁抱工業(yè)。
于是,當(dāng)成本和營收不匹配時,一個“互聯(lián)網(wǎng)泡沫式”的虧損現(xiàn)象出現(xiàn)了——2024年中國人形機器人企業(yè)的平均毛利率只有18%,優(yōu)必選2020-2024年上半年累計虧損更是高達43億。
03
突破口在哪里?
但是,相比于“前輩”,具身機器人又是一個“異數(shù)”。
如果你深入研究就會發(fā)現(xiàn),那些“前輩”遇冷的本質(zhì)原因是:概念先行、技術(shù)滯后、實用價值低。
以VR眼鏡為例,PICO、愛奇藝奇遇等品牌已先后碰壁。
其主要原因是,各類核心器件被少數(shù)供應(yīng)商壟斷,于是不僅缺乏開發(fā)迭代的動力,價格也居高不下,導(dǎo)致變成了“有錢人的玩具”。當(dāng)用戶有限的情況下,開發(fā)者回本周期長,精品內(nèi)容寥寥,用戶“買前激動、買后吃灰”,最后形成“低產(chǎn)出-低購買-低收入”的惡性循環(huán)。
再加上頭顯500克以上的墜感、半小時即熱的體驗硬傷,VR注定只能停留在硬核玩家的小圈層。
同理,元宇宙想象雖宏大,卻同樣繞不開算力、內(nèi)容、終端這三座大山。
于是,熱鬧過后,只剩概念。
但是,雖然具身智能同樣頂著“科幻”光環(huán),橫亙在面前的大山卻是可以移動的。
技術(shù)上,具身智能的崛起,始終與AI大模型的迭代同頻共振——這顆“智慧大腦”的進化速度,正以前所未有的力度推動著具身智能行業(yè)狂奔。
比如,智源的“慧思開物”平臺嘗試破解:用AI大模型驅(qū)動“大腦”規(guī)劃任務(wù),數(shù)據(jù)驅(qū)動“小腦”控制肢體,首次實現(xiàn)跨機械臂、人形機器人的統(tǒng)一控制。
再比如,廣汽集團與華為云的合作,通過盤古多模態(tài)能力,可在數(shù)分鐘內(nèi)復(fù)原復(fù)雜駕駛場景的2D視頻與3D點云數(shù)據(jù),使端到端模型迭代周期縮短至“兩天一個版本”。
硬件太貴?企業(yè)立馬更換方案——減速器、驅(qū)動器、傳感器,哪家貴就換哪家,國產(chǎn)平替立刻就能跟上需求。
松下HG-C激光位移傳感器起碼要1500元,國產(chǎn)泓川科技HC6做到把量程拉到800mm、采樣提到2000Hz的同時,價格最高只要899元。
為激勵具身智能的研究,深圳光明區(qū)直接宣布,2025年起,對新落戶的全國軟件百強企業(yè)、全國互聯(lián)網(wǎng)百強企業(yè)、全國人工智能綜合實力百強企業(yè),給予最高2000萬元獎勵;對新落戶的“國家鼓勵的重點軟件企業(yè)”,給予最高1000萬元獎勵。
場景落地慢?企業(yè)們一邊順應(yīng)市場,如優(yōu)必選Walker投入教育行業(yè),60%收入來自中小學(xué)AI興趣班;宇樹G1機器人在2024年直接拿下了比亞迪500臺訂單,只因其價格比進口貨少了一個零。
另一邊,各大企業(yè)紛紛開始研發(fā)專門的具身智能大模型,如Figure AI的Helix,實現(xiàn)跨場景任務(wù)成功率突破90%。
更關(guān)鍵的是,中國獨有的產(chǎn)業(yè)集群優(yōu)勢,為具身智能從實驗室走向生產(chǎn)線鋪就了黃金通道。
深圳光明科學(xué)城中,優(yōu)必選超級工廠、大疆創(chuàng)新中心、華為鴻蒙實驗室聚集,形成了“研發(fā)—測試—量產(chǎn)”的15分鐘生態(tài)圈,機器人企業(yè)專利密度高達每平方公里1200項,超硅谷同類園區(qū)3倍。
在長三角,3小時的車程覆蓋蘇州綠的諧波的減速器、寧波中大力德的伺服電機等核心供應(yīng)商;上海與杭州的之江實驗室共建“人機協(xié)同聯(lián)合實驗室”,每天處理1億條多模態(tài)交互數(shù)據(jù)。此外,長三角1萬多項機器人專利免費共享,節(jié)卡機器人直接省下30%研發(fā)成本,省下的錢完全可以投入下一場迭代。
具身智能的特殊之處在于:它既需要類似VR的硬件突破,又倚重大模型這類軟件革命。它的前途不由概念決定,而由技術(shù)迭代速度決定——每一代大模型升級,機器人的“腦力”就躍遷一次;每一次國產(chǎn)零部件替代,成本就下探一截。
還記得以前大家是怎么總結(jié)大疆的成功經(jīng)驗嗎?——大疆之所以成功,就是因為它剛好珠三角,每一次測試每一個零件的更換,迭代速度和試錯成本極地,而放在任何一個外國公司,研發(fā)一件消費電子產(chǎn)品,僅僅是零部件的定制、測試、選擇,就是大疆的三到五倍時間。
當(dāng)產(chǎn)業(yè)鏈的上下游都能自主可控的時候,中國的工業(yè)基礎(chǔ)就是具身智能最大的底氣,使它從一個虛無縹緲的概念,迅速轉(zhuǎn)化成直指物理世界的生產(chǎn)力革命。