創(chuàng )澤機器人 |
CHUANGZE ROBOT |
三年前,人形機器人還處于陽(yáng)春白雪的科研階段,這兩年發(fā)展迅猛。那么,人形機器人當前面臨的問(wèn)題是什么?突破的方向在哪里?未來(lái)的應用在哪里?前不久,在上海2025人形機器人產(chǎn)業(yè)高質(zhì)量發(fā)展論壇上,地方共建人形機器人創(chuàng )新中心(簡(jiǎn)稱(chēng)“國地中心”)席科學(xué)家江磊介紹了他的看法,并提出與產(chǎn)業(yè)鏈共同打造出四位一體生態(tài)的觀(guān)點(diǎn)。
人形機器人在各大證券市場(chǎng)已經(jīng)有了概念股,從2024年1月開(kāi)始,還是平平淡淡的發(fā)展,為什么到了8月,整個(gè)二J市場(chǎng)被急速拉動(dòng)?
先,一定是人形機器人行業(yè)找到了一個(gè)技術(shù)突破、可發(fā)力的對象。
第二,政策方面,今年一開(kāi)年,要設立相應的重大項目,原因可能是我們想緩解勞動(dòng)力缺口,以及應對未來(lái)人口老齡化的挑戰。
第三,從產(chǎn)品端看,人形機器人迎來(lái)了GPT時(shí)刻。此時(shí)尤其令我們自豪的是,在這個(gè)高科技領(lǐng)域的起步階段,我國登上了世界舞臺,已有一些有代表性的企業(yè)和樣機。
第四,從行業(yè)角度看,千行百業(yè)都在關(guān)注。據統計,現在已有100家左右的整機公司,預計到今年年底會(huì )有200多家,還有數千家的核心零部件廠(chǎng)家,這構成了一個(gè)大生態(tài)。汽車(chē)行業(yè)、手機行業(yè)、制造行業(yè)、互聯(lián)網(wǎng)、國央企都在投入。一個(gè)共性原因是:在一個(gè)行業(yè)處于發(fā)展的高峰期或瓶頸期,內卷就開(kāi)始出現,因此這五大行業(yè)、企業(yè)都找到了發(fā)力點(diǎn):人形機器人,認為是破解行業(yè)規律性周期性難題的一個(gè)主要動(dòng)因。國外也是如此,今年年初,蘋(píng)果、三星、現代等開(kāi)始設立人形機器人的硬件團隊。今年阿里也在張江模力社區(注:“國地中心”搭建)設立了智能機器人的硬件團隊。
在此,“通用化”會(huì )成為一個(gè)經(jīng)濟活動(dòng)的名詞。過(guò)去人們會(huì )把通用化做成技術(shù),所以業(yè)界一直在爭論:是做專(zhuān)用機器人,還是做通用機器人?其實(shí)這種爭論沒(méi)有什么意義,因為技術(shù)都是為場(chǎng)景服務(wù)的。所謂的場(chǎng)景驅動(dòng)就是有沒(méi)有市場(chǎng),廠(chǎng)家的產(chǎn)品能不能找到市場(chǎng)、銷(xiāo)售出去。所以“通用化”更重要的是在一個(gè)新興市場(chǎng),單品能否過(guò)10萬(wàn)臺的門(mén)檻。今年人形機器人單品可能會(huì )過(guò)1萬(wàn)臺的門(mén)檻,但更期待未來(lái)是百萬(wàn)臺、百億臺的產(chǎn)業(yè)規模。目前10萬(wàn)臺將是一個(gè)重要的門(mén)檻。另一個(gè)角度,如果做一個(gè)產(chǎn)品,單品要10萬(wàn)臺,它可用在哪些場(chǎng)景呢?這值得我們去深入思考,再從“通用化”來(lái)考慮產(chǎn)品定義和設計如何去做。
有一個(gè)高價(jià)值飛輪的理論。三年前,人形機器人是個(gè)萬(wàn)億元的潛在賽道,因此發(fā)布了政策來(lái)加速促進(jìn)人形機器人的發(fā)展,使其對于公眾來(lái)說(shuō)不再陌生,不經(jīng)意間,在電視節目或某個(gè)商場(chǎng)的轉角就能看到人形機器人,它正在形成一個(gè)巨大的產(chǎn)品市場(chǎng)。因此,今年是完成高價(jià)值飛輪的重要一年。那么能否實(shí)現規模和量產(chǎn)?高價(jià)值飛輪的核心驅動(dòng)力還是來(lái)自于顛覆性的技術(shù)。
為什么2024年8月人形機器人的二J市場(chǎng)會(huì )被急速拉升?因為顛覆性技術(shù)起到了決定性的作用。
工信部提出了兩大革命:“機器人+革命”與“人工智能+革命”,它們對應的都是新質(zhì)生產(chǎn)力!皺C器人+”是新質(zhì)硬件生產(chǎn)力,“人工智能+”是新質(zhì)軟件生產(chǎn)力?梢(jiàn),新質(zhì)生產(chǎn)力是軟硬一體化的典型代表。在這樣的一個(gè)產(chǎn)業(yè)、技術(shù)、行業(yè)、規模、政策里,其中的線(xiàn)索一定是技術(shù)驅動(dòng)了這次技術(shù)革命。
先,其背后的邏輯,以π0團隊為代表,去年8月Physical Intelligence次發(fā)布了通用人形機器人的視覺(jué)-語(yǔ)言-動(dòng)作模型(VLA),F在VLA已經(jīng)成為一個(gè)事實(shí)標準。如果回到去年8月之前,相信90%的專(zhuān)家會(huì )認為機器人的操作還不屬于預訓練(注:語(yǔ)言/ChatGPT是大模型,是預訓練),我們雙手的操作不是預訓練,但是,從8月開(kāi)始,π0團隊發(fā)現它也是一個(gè)大規模預訓練架構。大算力大模型也是大力出奇跡的一個(gè)行業(yè),并被證明這種方式是可以的。
實(shí)際上,不僅π0發(fā)現,國內外同時(shí)十二個(gè)團隊用10萬(wàn)的數據集、30萬(wàn)的數據集、現在用80萬(wàn)的數據集激勵了以后,整個(gè)任務(wù)達成率也是直線(xiàn)上升。
我們堅信規模法則與后訓練將會(huì )促進(jìn)這一次人形機器人Z終的一個(gè)閉環(huán)。
當然還有一部分—智駕,例如,特斯拉的FSD V12幫助印證,現在也轉向VLA。而之前做汽車(chē)的人是做端側,發(fā)現VLA也很好用。
人們如果了解VLA的誕生,其完全不是為汽車(chē)設計的,是為谷歌的一款類(lèi)人形機器人的構型設計,結果沒(méi)想到VLA也撐起了智駕的半邊天。
當然,還是要回到人形機器人,僅有VLA夠不夠?
去年Figure聯(lián)合OpenAI造出了Figure 01,可以看到大模型是在人形機器人的Z上層,是采用大腦、小腦+肢體的分層類(lèi)人架構來(lái)實(shí)現的。去年我國在“世界人工智能大會(huì )(WAIC)”上也推出了我國自己的大腦、小腦、驅動(dòng)架構,今年正進(jìn)一步完善。
人形機器人有沒(méi)有一個(gè)通用的完全端到端的大模型?現在VLA解決了上層的,下層有一個(gè)控制模型是屬于分層架構,但能不能用一個(gè)分層實(shí)現完全端到端?有一篇論文支持了這樣的觀(guān)點(diǎn)。因此,三年前,語(yǔ)言進(jìn)入了大模型(例如ChatGPT),去年雙手操作進(jìn)入大模型(例如VLA),現在的問(wèn)題是:下肢行走以及全身運動(dòng)是不是一個(gè)大模型?堅信將來(lái)會(huì )有一個(gè)大模型,能夠讓人形機器人、四足機器人以及汽車(chē)來(lái)實(shí)現統一的駕駛。
人形機器人行業(yè)目前有四類(lèi):
汽車(chē)智駕的具身模型;
機器人上肢操作/VLA;
人形分層策略;
芯片/GPU。
整個(gè)具身智能產(chǎn)業(yè)正在爆發(fā),所有路徑都需要大數據,所以在去年“國地中心”組建了訓練場(chǎng)來(lái)推動(dòng)這件事。
“國地中心”的麒麟具身智能訓練場(chǎng)有五項功能,除了收集數據,訓練場(chǎng)的另外一個(gè)作用是對現在的大模型進(jìn)行檢測與評定,提出大模型的benchmark,例如,做一個(gè)什么樣的大模型更適合人形機器人?現在需要一個(gè)行業(yè)的基準線(xiàn)。
目前人形機器人在跑得快、拿得準、訓得好、通用化方面都有代表性公司。Z近業(yè)界在爭論:是不是機器人都需要走跑跳?是不是應該進(jìn)廠(chǎng)打工?實(shí)際上,目前有四類(lèi)人在研究,跑得快的人不做抓取,做抓取的不做跑得快,做訓練的人大多數都是人工智能的人,做“通用化”的人是做基礎設施的。高動(dòng)態(tài)的硬件平臺、準確抓取的具身智能、訓練的實(shí)訓場(chǎng)、通用泛化的數據集—這四件事,哪怕有一件事做不好,人形機器人的軟硬件的終極難題就落不了地,所以我們需要要發(fā)展生態(tài)。
回到發(fā)展的起點(diǎn):人形機器人未來(lái)一定是進(jìn)廠(chǎng)打工以及為我們養老。例如養老,還有八
項卡脖子技術(shù)沒(méi)有打通。人們面對未來(lái)的通用化,一定不是針對八個(gè)問(wèn)題建立八個(gè)模型,甚至建立幾百個(gè)模型來(lái)解決,人們希望構造一個(gè)完全端到端的模型,來(lái)同時(shí)解決八項卡脖子技術(shù),這樣才能實(shí)現Z終通用化的夢(mèng)想。
江磊老師有個(gè)激進(jìn)的預測:做硬件平臺的得去做小的機器人,這樣迭代的速度更快。做具身智能現在很火,但是千萬(wàn)不要只做操作,行走大模型已成為今年國際競爭的熱點(diǎn)!皣刂行摹钡茸鰧(shí)訓場(chǎng)的人一定要去做自己的世界模型,以及做數據集的人要用開(kāi)源的方式來(lái)完成整個(gè)生態(tài)的構建。
人形機器人從當前的角度來(lái)看,四位一體的生態(tài)還沒(méi)有完全建立!皣刂行摹毕M鷺I(yè)界共同打造出我國的四位一體生態(tài)。
今年人形機器人是可以量產(chǎn)的,但真正的大規模的應用還沒(méi)到來(lái)。我們加速建立四位一體的生態(tài),才能加速人形機器人產(chǎn)業(yè)的到來(lái)。
![]() |
機器人底盤(pán) Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動(dòng)機器人底盤(pán) 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 展廳機器人 服務(wù)機器人底盤(pán) 核酸采樣機器人 智能配送機器人 導覽機器人 |