8月16日至21日,2023世界機(jī)器人(300024)大會(huì)在北京舉行。大會(huì)期間,北京市政府發(fā)布了《北京市機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)方案(2023—2025年)》,提出著眼世界前沿技術(shù)和未來(lái)戰(zhàn)略需求,加緊布局人形機(jī)器人,帶動(dòng)醫(yī)療健康、協(xié)作、特種、物流四類(lèi)優(yōu)勢(shì)機(jī)器人產(chǎn)品躍升發(fā)展。
(資料圖片)
機(jī)器人的應(yīng)用場(chǎng)景可謂極其廣泛,人形機(jī)器人自然也不例外,在小米集團(tuán)高級(jí)副總裁曾學(xué)忠的設(shè)想里,未來(lái)的智能制造體系中,70%的工作由自動(dòng)化設(shè)備來(lái)完成;20%應(yīng)當(dāng)由仿真機(jī)器人來(lái)完成;剩下的10%需要人來(lái)完成。
今年以來(lái),在AI浪潮的推動(dòng)下,AI+人形機(jī)器人帶來(lái)的“具身智能”受到了市場(chǎng)關(guān)注。工業(yè)和信息化部副部長(zhǎng)徐曉蘭表示,以人形機(jī)器人和通用人工智能為代表的新技術(shù)、新產(chǎn)品、新業(yè)態(tài)蓬勃發(fā)展,正成為全球科技創(chuàng)新的制高點(diǎn)。
人形機(jī)器人前景廣闊
機(jī)器人的發(fā)展跟隨制造業(yè)自動(dòng)化程度不斷提升,從最早的單任務(wù)起重機(jī)式臂到機(jī)器人,再到能夠與人直接交互的協(xié)作機(jī)器人,再發(fā)展到與人工智能結(jié)合的人形機(jī)器人。
受全球勞動(dòng)力缺口持續(xù)擴(kuò)大影響,人形機(jī)器人替代帶動(dòng)巨大市場(chǎng)需求,東吳證券(601555)預(yù)計(jì),在特斯拉人形機(jī)器人標(biāo)桿引領(lǐng)作用下,全球在2025年初步實(shí)現(xiàn)人形機(jī)器人商業(yè)化,實(shí)現(xiàn)銷(xiāo)量2萬(wàn)-3萬(wàn)臺(tái)。到2030年,新增需求100萬(wàn)臺(tái),2035年銷(xiāo)量有望突破1000萬(wàn)臺(tái)。
隨著人形機(jī)器人技術(shù)的不斷發(fā)展和應(yīng)用場(chǎng)景的不斷拓展,市場(chǎng)規(guī)模有望不斷擴(kuò)大,其中,核心零部件方向是多家機(jī)構(gòu)預(yù)計(jì)受益的重點(diǎn)方向。具體而言,人形機(jī)器人身體核心零部件可以分為諧波減速器、行星滾柱絲杠、伺服電機(jī)三部分;手部核心零部件可以分為空心杯電機(jī)、微型行星齒輪箱兩部分。
結(jié)合2030年人形機(jī)器人需求數(shù)量,西南證券(600369)測(cè)算,五大核心零部件的市場(chǎng)空間于2030年市場(chǎng)規(guī)模如下:
1)諧波減速器:?jiǎn)闻_(tái)機(jī)器人諧波減速器數(shù)量為14個(gè),2030年單價(jià)有望降到600元,樂(lè)觀/中性/悲觀情景下市場(chǎng)空間分別為168/126/67億元;
2)行星滾柱絲杠:?jiǎn)闻_(tái)機(jī)器人行星滾柱絲杠數(shù)量為14個(gè),2030年單價(jià)有望降到2000元,樂(lè)觀/中性/悲觀情景下市場(chǎng)空間分別為560/420/224億元;
3)伺服電機(jī):?jiǎn)闻_(tái)機(jī)器人伺服電機(jī)數(shù)量28個(gè),2030年單價(jià)有望降到300元,樂(lè)觀/中性/悲觀情景下市場(chǎng)空間分別為168/126/67億元。
4)空心杯電機(jī):?jiǎn)闻_(tái)機(jī)器空心杯電機(jī)數(shù)量為12個(gè),2030年單價(jià)有望降到400元,樂(lè)觀/中性/悲觀情景下市場(chǎng)空間分別為96/72/38億元;
5)微型行星齒輪箱:?jiǎn)闻_(tái)機(jī)器人行星滾柱絲杠數(shù)量為12個(gè),2030年單價(jià)有望降到200元,樂(lè)觀/中性/悲觀情景下市場(chǎng)空間分別為48/36/19億元。
據(jù)國(guó)際機(jī)器人協(xié)會(huì)預(yù)測(cè),2021年到2030年,全球人形機(jī)器人市場(chǎng)規(guī)模年復(fù)合增長(zhǎng)率將高達(dá)71%。中國(guó)電子學(xué)會(huì)數(shù)據(jù)顯示,到2030年,我國(guó)人形機(jī)器人市場(chǎng)規(guī)模有望達(dá)到約8700億元。
AI如何賦能“具身智能”?
從產(chǎn)業(yè)角度考慮,人形機(jī)器人是AI和機(jī)器人兩大產(chǎn)業(yè)的共同發(fā)展方向,是技術(shù)、制造、服務(wù)三個(gè)核心能力的交匯點(diǎn),也是軟硬件跟AI技術(shù)融合的制高點(diǎn)。目前,人形機(jī)器人的硬件主要包括五部分:
1)感知系統(tǒng),相當(dāng)于機(jī)器人的“五官”,包括聲音、光、溫度、壓力、定位、接觸等傳感器,用以將外部環(huán)境信號(hào)轉(zhuǎn)換為機(jī)器人可以理解的信息或數(shù)據(jù);2)驅(qū)動(dòng)系統(tǒng),相當(dāng)于機(jī)器人的“肌肉”,電機(jī)驅(qū)動(dòng)包括電機(jī)、減速器、編碼器等;3)末端執(zhí)行系統(tǒng),相當(dāng)于機(jī)器人的“手”,用以和外界環(huán)境進(jìn)行交互;4)能源供應(yīng),電源或電池;5)運(yùn)算系統(tǒng)及軟件,相當(dāng)于機(jī)器人的“大腦”。
各大科技巨頭紛紛推出AI大模型,有望解決人形機(jī)器人的通用性問(wèn)題。AI大模型對(duì)人形機(jī)器人的賦能可以從語(yǔ)音、視覺(jué)、決策、控制等多方面實(shí)現(xiàn),形成感知、決策、控制閉環(huán),使機(jī)器人具備常識(shí)。國(guó)泰君安(601211)認(rèn)為,具體可以分為三個(gè)方向:
1)語(yǔ)音:語(yǔ)言大模型為機(jī)器人的自主語(yǔ)音交互難題提供了解決方案,在上下文理解、多語(yǔ)種識(shí)別、多輪對(duì)話、情緒識(shí)別、模糊語(yǔ)義識(shí)別等通用語(yǔ)言任務(wù)上,ChatGPT顯著優(yōu)于深度學(xué)習(xí),表現(xiàn)出了不亞于人類(lèi)的理解力和語(yǔ)言生成能力。
2)視覺(jué):人形機(jī)器人的場(chǎng)景相對(duì)工業(yè)機(jī)器人更通用、更復(fù)雜,通用視覺(jué)大模型的All in One的多任務(wù)訓(xùn)練方案能使得機(jī)器人更好地適應(yīng)人類(lèi)生活場(chǎng)景。大模型的強(qiáng)擬合能力使人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語(yǔ)義分割等任務(wù)時(shí),具備更高的精確度;通用視覺(jué)大模型通過(guò)大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)(603138)獲得的預(yù)訓(xùn)練模型具有較好的知識(shí)完備性,提升場(chǎng)景泛化效果。
3)決策:基于多模態(tài)的預(yù)訓(xùn)練大模型將增強(qiáng)機(jī)器人可完成任務(wù)的多樣性與通用性,讓其不局限于文本和圖像等單個(gè)部分,而是多應(yīng)用相容,拓展單一智能為融合智能,使機(jī)器人能結(jié)合其感知到的多模態(tài)數(shù)據(jù)實(shí)現(xiàn)自動(dòng)化決策。
多個(gè)難題依舊待解
在AI浪潮下,2023年,人形機(jī)器人受到了不同以往的密集關(guān)注,商業(yè)化落地的大方向是有的,但目前,產(chǎn)業(yè)發(fā)展還面臨著諸多挑戰(zhàn)。
清華大學(xué)交叉信息研究院院長(zhǎng)姚期智指出,目前人形機(jī)器人還面臨三個(gè)發(fā)展問(wèn)題:首先,機(jī)器人還需要像大語(yǔ)言模型一樣擁有一個(gè)具身模型,一步到位做好最底層的控制;其次,在計(jì)算能力方面,即使是谷歌的Robotic Transformer模型,也只能達(dá)到3個(gè)赫茲水平,距離真正需要的500個(gè)赫茲還有很大差距;此外,機(jī)器人多模態(tài)的感官感知融合和數(shù)據(jù)收集方面,還有大量的挑戰(zhàn)和問(wèn)題。
在AI部分,通用大模型本身并不是給通用人形機(jī)器人使用的,即使目前通用大模型已經(jīng)能很好地處理文本或者基本文字邏輯,但是它對(duì)環(huán)境的認(rèn)知和感知能力基本是零,無(wú)法認(rèn)知物理環(huán)境,也沒(méi)法抓取做操作,需要新的模型來(lái)訓(xùn)練。
除此之外,硬件性能與成本的平衡也是一大問(wèn)題。
星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇表示,對(duì)硬件來(lái)說(shuō),行業(yè)希望機(jī)器人同時(shí)兼顧力量、速度、精度以及成本,但是目前所有技術(shù)都無(wú)法同時(shí)兼顧這幾項(xiàng),例如液壓的技術(shù)速度和力量都很強(qiáng),但是它成本太貴。
而高減速比諧波技術(shù),可能精度比較高,但是靈巧性又降低;而新的轉(zhuǎn)制期技術(shù)雖然成本比較低,但是卻犧牲了載荷和精度,因此現(xiàn)在還沒(méi)有一個(gè)能夠兼顧所有達(dá)到滿(mǎn)意的情況。
至于“具身智能”真正落地的時(shí)間,陳建宇表示,當(dāng)前人形機(jī)器人、通用機(jī)器人還處于一個(gè)剛剛開(kāi)始的階段,問(wèn)題不會(huì)很快得以解決,這是比較長(zhǎng)期的過(guò)程,可能是5-10年,也可能更長(zhǎng)。
關(guān)鍵詞: