從今年春晚到兩會,機(jī)器人火了,伴隨機(jī)器人出圈的還有一個新詞:具身智能。

具身智能是人工智能、機(jī)器人學(xué)、認(rèn)知科學(xué)的交叉領(lǐng)域,主要研究如何使機(jī)器人具備類似人類的感知、規(guī)劃、決策和行為能力。其中,具身智能機(jī)器人強(qiáng)調(diào)智能體須具備物理身體,通過傳感器感知環(huán)境,結(jié)合算法進(jìn)行自主規(guī)劃與決策,最終通過執(zhí)行器完成物理交互任務(wù),實現(xiàn)“感知—行動”的閉環(huán)。

目前,北京已擁有人工智能相關(guān)企業(yè)約2400家,2024年全年北京人工智能核心產(chǎn)業(yè)規(guī)模已突破3000億元。其中,具身智能領(lǐng)域數(shù)百家企業(yè)已在北京多個園區(qū)顯現(xiàn)出集群效應(yīng),在具身智能產(chǎn)業(yè)的人形化、人性化、應(yīng)用化等方面取得重要突破,形成了以“大腦、小腦、本體”為核心的具身智能全產(chǎn)業(yè)鏈條。
本體升級 解鎖具身智能機(jī)器人的多元本領(lǐng)
為了最大限度適配人類環(huán)境,達(dá)到資源利用率最大化。在北京,有不少企業(yè)選擇直接將具身智能機(jī)器人開發(fā)為“人形”形態(tài),這個靈活且堅硬的外殼就稱為它的“本體”。那么,北京在具身智能機(jī)器人的本體方面發(fā)展如何?在技術(shù)方面實現(xiàn)了哪些關(guān)鍵突破?從室內(nèi)場景到室外環(huán)境,他們都掌握了哪些新技能?
這個奔跑著穿越戈壁、公路、草地的機(jī)器人叫作STAR1,它是北京星動紀(jì)元公司推出的最新款人形機(jī)器人。它身高171cm,體重63kg,全身共有55個自由度,可在室外真實場景達(dá)到3.6m/s的奔跑速度,這也一舉打破了電驅(qū)人形機(jī)器人奔跑速度的世界紀(jì)錄。

北京星動紀(jì)元科技有限公司聯(lián)合創(chuàng)始人 席悅:要跑得快,除了在關(guān)節(jié)轉(zhuǎn)矩,輸出轉(zhuǎn)矩比較高的情況下,還要保證輸出的轉(zhuǎn)速足夠高,這兩者加起來,其實是它關(guān)節(jié)的輸出功率要足夠高才能實現(xiàn)。想跑得穩(wěn),除了剛剛提到這兩點(diǎn)以外,還得確保結(jié)構(gòu)的穩(wěn)定性要足夠好,這個就包括結(jié)構(gòu)的剛性強(qiáng)度要足夠高。

而除了跑得快、跑得穩(wěn)以外,STAR1還具備抓得動、抓得準(zhǔn)的技能,它所配備的靈巧手雖與人類手掌大小相當(dāng),但卻裝配了12個主動、全直驅(qū)自由度,僅需動用單手四指便可提動20kg的重物。

而且,在經(jīng)過自研的端到端原生機(jī)器人大模型深度學(xué)習(xí)與訓(xùn)練后,STAR1還可自主完成用筷子夾水餃、用手捏骰子等精細(xì)化靈巧操作。此外,靈巧手上所配備的高分辨率觸覺陣列傳感器,可提供精確的三維力觸覺和溫度信息,使其在抓取玻璃杯等易碎物品時也能保持合適的力度,保障安全操作。

北京星動紀(jì)元科技有限公司聯(lián)合創(chuàng)始人 席悅:最終就是想實現(xiàn)機(jī)器人走進(jìn)家庭,手足夠靈巧的話,它就可以更適應(yīng)家庭環(huán)境,很完美地融入人類居住的環(huán)境,也能使用人類的工具去做更多任務(wù)。
而另一邊,北京市朝陽區(qū)的一家企業(yè)也正在進(jìn)行具身智能人形機(jī)器人的研發(fā)工作,只不過,這位機(jī)器人與前面的大不相同,他們在搭建機(jī)器人本體的基礎(chǔ)上,還為機(jī)器人賦予了皮膚,并通過深度學(xué)習(xí)和訓(xùn)練,使這款仿生交互智能機(jī)器人可驅(qū)動面部的仿生肌肉與皮膚,向人們表現(xiàn)出涵蓋6類基礎(chǔ)情緒的200多種動態(tài)表情,并可做到漢語、英語、韓語等多種語言與口型的擬合表現(xiàn)。

北京清飛科技有限公司研發(fā)一部技術(shù)總監(jiān) 李孟偉:如果它能用情緒輸出,這樣天然跟人就比較親近。我們希望把這個延伸出來,第一作為接待,第二可能會在養(yǎng)老社區(qū)做一些落地。
“大小腦”協(xié)同 讓智能機(jī)器人服務(wù)更多場景
具身智能機(jī)器人的泛化能力,主要來自它的“大腦”和“小腦”,也就是具身大模型,需要聽懂指令,并帶動本體具體實施行動和行為。同時,機(jī)器人會根據(jù)動態(tài)變化的環(huán)境自動調(diào)整工作方式,這是檢驗機(jī)器人實用性的重要標(biāo)準(zhǔn)。
目前,適用于各行業(yè)的泛化機(jī)器人正從實驗室走到生活中,相關(guān)部門和企業(yè)正在推動它們逐步出現(xiàn)在工廠、便利店甚至是足球場上,并將在未來達(dá)到滿足人類真正生產(chǎn)生活所需所用,賦能千行百業(yè)。
在北京的一處研發(fā)中心,機(jī)器人正精準(zhǔn)地依據(jù)指令抓取貨架商品以完成售賣。它通過解析指令、掃描貨架,直接抓取產(chǎn)品。研究團(tuán)隊表示,機(jī)器人模型落地過程中,不同場景就會有不同的特殊需求。

北京銀河通用機(jī)器人有限公司市場部相關(guān)負(fù)責(zé)人 武文韜:我們將具身大模型的能力賦能到了機(jī)器人的身體里面,幫助它既可以理解人類指令,也可以在各種場景下完成各種各樣的任務(wù),具備通用機(jī)器人的能力。比如它可以在商超里面去執(zhí)行取貨,工廠里面去做料箱的搬運(yùn)、分揀;家庭里面還可以去疊衣服、清理垃圾、清理雜物,完成家務(wù)。

目前,具身大模型的泛化訓(xùn)練已經(jīng)做好了落地應(yīng)用的準(zhǔn)備,在無人值守的便利店和藥店的展示場景中,機(jī)器人可以抓取袋裝、瓶裝、易碎、異形的多種商品,從接收、取單再到完成商品抓取并送貨,只需40秒左右。

北京銀河通用機(jī)器人有限公司市場部相關(guān)負(fù)責(zé)人 武文韜:下一步,我們將更好地用AI賦能大模型,將機(jī)器人的多模態(tài)交互能力提升。比如在語音這方面,人們可以和機(jī)器人進(jìn)行對話,了解商品的品牌、價格、保質(zhì)期等等相關(guān)信息,優(yōu)化大家的購物體驗。

除了在商業(yè)領(lǐng)域,植入具身智能大模型的機(jī)器人已經(jīng)進(jìn)軍千行百業(yè)。在這塊176平方米的室內(nèi)綠茵場上,6位機(jī)器人“運(yùn)動員”的足球賽進(jìn)行得如火如荼,通過AI大模型集成的跨地形自適應(yīng)步態(tài)、抗擾動運(yùn)動和上下肢協(xié)同控制等多種算法,讓機(jī)器人足球賽成為現(xiàn)實。
近日,在北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū),智能機(jī)器犬還加入了治安巡邏編隊,機(jī)器犬可適應(yīng)暴雨、高溫等極端環(huán)境。其背部模塊化設(shè)計支持快速加裝防爆設(shè)備、氣體檢測儀等通用工具,可靈活應(yīng)對巡邏、排爆等多樣化任務(wù)。

北京經(jīng)開區(qū)政法工作部工作人員 安家良:它是一個具備工業(yè)級工況能力的智慧犬,不僅能夠適應(yīng)野外復(fù)雜的工況,可以有效補(bǔ)充無人巡邏車隊無法在鋪裝路面上行駛的短板,在一些內(nèi)部空間、野外溝壑進(jìn)行有效的偵查。下一步,智慧巡邏犬隊將接入城市智慧系統(tǒng),結(jié)合AI算法將會在日常行為感知、火災(zāi)預(yù)測上作出更多貢獻(xiàn)。
啟動三年培育計劃 沖刺千億級產(chǎn)業(yè)集群
為進(jìn)一步激發(fā)北京具身智能領(lǐng)域創(chuàng)新資源優(yōu)勢,加快實現(xiàn)具身智能領(lǐng)域科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新深度融合。近期,北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會等部門發(fā)布并已經(jīng)啟動實施了相關(guān)產(chǎn)業(yè)的三年培育行動計劃,將從技術(shù)創(chuàng)新、平臺支撐、場景牽引、生態(tài)優(yōu)化等四個維度,推動北京具身智能高質(zhì)量發(fā)展。
《行動計劃》指出,未來3年,北京不僅將通過揭榜掛帥等機(jī)制,持續(xù)突破具身大腦模型、小腦技能庫、智能芯片等關(guān)鍵技術(shù),提升具身機(jī)器人復(fù)雜任務(wù)處理能力,強(qiáng)化產(chǎn)品硬實力。還將針對當(dāng)下具身數(shù)據(jù)采集中所存在的數(shù)據(jù)規(guī)模小、采集成本高、格式規(guī)范不統(tǒng)一等問題,建設(shè)多模態(tài)通用的具身數(shù)據(jù)采集平臺,切實解決具身智能企業(yè)發(fā)展難題。

北京市科委、中關(guān)村管委會信息科技處處長 韓。簽榱似平鈹(shù)據(jù)瓶頸問題,北京市科委今年將依托新型研發(fā)機(jī),來構(gòu)建設(shè)具身數(shù)據(jù)采集平臺,打造虛實結(jié)合的具身智能數(shù)據(jù)采集訓(xùn)練場,并建立具身數(shù)據(jù)的數(shù)據(jù)聯(lián)合運(yùn)營和開放的共享機(jī)制,年底前我們預(yù)計構(gòu)建并開放300萬條高質(zhì)量通用具身智能數(shù)據(jù)集。

此外,北京還將充分發(fā)揮具身智能對科研教育、工業(yè)商業(yè)、個性化應(yīng)用等場景的賦能作用。優(yōu)先推動在科研教育場景擴(kuò)大開發(fā)者生態(tài),逐步推進(jìn)在汽車生產(chǎn)、商業(yè)零售等領(lǐng)域聯(lián)合研發(fā)和規(guī);瘓鼍奥涞兀⑶罢疤剿骷彝シ⻊(wù)、養(yǎng)老助老場景等人機(jī)共生環(huán)境應(yīng)用解決方案,力爭推動萬臺機(jī)器人規(guī)模落地,培育千億級產(chǎn)業(yè)集群。

北京市科委、中關(guān)村管委會信息科技處處長 韓。旱2027年,我們希望北京能夠打造出具有國際影響力的具身智能產(chǎn)業(yè)生態(tài),突破百余項關(guān)鍵技術(shù),具身大小腦模型、智能芯片、全身運(yùn)動控制等上下游產(chǎn)業(yè)鏈基本實現(xiàn)國產(chǎn)化。在科研教育、工業(yè)商業(yè)、個性化服務(wù)三大場景實現(xiàn)不少于100項規(guī)模化應(yīng)用,培育核心企業(yè)不少于50家,建設(shè)不少于2個具身智能特色產(chǎn)業(yè)園,推動具身智能真正成為首都經(jīng)濟(jì)發(fā)展的另一“增長極”。
。ǹ偱_記者 王勝東 康駿馳 張一郎 毛宇軒 趙晨)