国产精品在线视频资源|av人人人人操爱香蕉视频|AAA黄色片子黄色a级片视频|亚洲综合视频网2|成人免费网站观影|国产天堂AV在线播放资源|成人无码精品一区二区黑寡妇在线|论理聚合视频一区二区三区|在线无码视频一区二区|淫荡人妻不卡av

  1. 首頁
  2. 資訊
  3. 市場(chǎng)
  4. 圓桌對(duì)話:聊聊具身智能的共識(shí)與非共識(shí)

圓桌對(duì)話:聊聊具身智能的共識(shí)與非共識(shí)

蓋世汽車

12月8日,地平線首屆技術(shù)生態(tài)大會(huì)(Horizon Together 2025)在深圳啟幕。大會(huì)以“向高同行”為主題,匯聚全球汽車產(chǎn)業(yè)鏈頭部公司,聚焦“加速全場(chǎng)景輔助駕駛量產(chǎn)普及”的階段性使命,分享前沿實(shí)踐,凝聚關(guān)鍵共識(shí)。

其中在“從智能汽車到機(jī)器人的技術(shù)躍遷”專題論壇上,本末科技創(chuàng)始人兼CEO張笛、極佳視界創(chuàng)始人兼CEO黃冠、優(yōu)必選研究院A1大模型與交互部負(fù)責(zé)人石海林、香港大學(xué)數(shù)據(jù)科學(xué)研究院助理教授李弘揚(yáng)、地瓜機(jī)器人CEO王叢等多位嘉賓就當(dāng)前具身智能領(lǐng)域的共識(shí)與非共識(shí)話題展開了深度探討。

圓桌對(duì)話:聊聊具身智能的共識(shí)與非共識(shí)

圓桌正文:  

現(xiàn)在,我們即將進(jìn)入今天下午的圓桌對(duì)話環(huán)節(jié)。本場(chǎng)圓桌的議題為:「名」人不說暗話:聊聊具身智能的共識(shí)與非共識(shí)。

今天很高興邀請(qǐng)到極客公園創(chuàng)始人張鵬先生來擔(dān)任本場(chǎng)圓桌的主持人。作為一名擁有超過二十年經(jīng)驗(yàn)的資深科技觀察家,他始終身處創(chuàng)新一線,對(duì)中國(guó)商業(yè)與技術(shù)的互動(dòng)演進(jìn)有著深刻而獨(dú)到的理解。下面讓我們有請(qǐng)張鵬先生登場(chǎng)!同時(shí),有請(qǐng)各位對(duì)話嘉賓一同登臺(tái)。掌聲歡迎各位!

 張鵬:非常高興今天來到地平線機(jī)器人生態(tài)大會(huì),應(yīng)該這是第一年辦這個(gè)大會(huì),我一直能感受到這個(gè)大會(huì)可能未來對(duì)整個(gè)行業(yè)有持續(xù)的影響。而且確實(shí)跟余凱認(rèn)識(shí)很多年了,從地平線的誕生就一直目睹這家公司發(fā)展,其實(shí)他剛才說得挺真實(shí)的,早年間他也一直跟我說,不管是智駕還是具身智能,這件事都保持比較悲觀,但我覺得他的悲觀是不同的聚焦,有時(shí)候你的悲觀只是讓你不過度浪費(fèi)自己在這個(gè)階段的經(jīng)歷,但是他可以迅速?gòu)谋^轉(zhuǎn)向樂觀,這可能是技術(shù)創(chuàng)新里面非常重要的能力。

今天我們的圓桌還挺有意思的,我們有搞技術(shù)的,搞產(chǎn)品的,還有搞研究的,幾個(gè)維度湊在一起,正好能拼成一個(gè)有意思的拼圖,而且大家的技術(shù)路線各方面也不一定都一樣,所以順著這個(gè)視角,可以開啟我們今天的探討。爭(zhēng)取把里面的一些共識(shí)也好,非共識(shí)也好,能碰撞出更多的火花。我覺得開啟的第一個(gè)話題還是去聊一聊最近也比較熱的所謂的人形概念,我知道本末是做直驅(qū)型的機(jī)器人關(guān)節(jié)對(duì)吧?但我反而想把人形這個(gè)問題先問你,因?yàn)槟憧隙ㄔ谶@條線上是看過人形和雙足這種形態(tài)的,那你們還會(huì)堅(jiān)持往這方面去走,這里邊你怎么理解?就是雙足這個(gè)事兒,今天可能會(huì)遇到的挑戰(zhàn)和包括你為什么當(dāng)時(shí)選擇的是另一個(gè)不同的路線,先聽聽你的觀點(diǎn)。

  張笛:首先是本末我們自己一方面有一個(gè)直驅(qū)型的機(jī)器人關(guān)節(jié)的特色技術(shù)平臺(tái),另外一塊是以輪足為特色的具身智能的機(jī)器人技術(shù)平臺(tái)。我們選擇這個(gè)方向出發(fā)點(diǎn)跟剛才張鵬老師講到的,我們作為技術(shù)型的創(chuàng)業(yè)者,對(duì)樂觀和悲觀我們到底應(yīng)該怎么看,怎么樣去建模?因?yàn)槲覀€(gè)人包括我們整個(gè)團(tuán)隊(duì)其實(shí)一直是對(duì)未來持有無限樂觀,但是對(duì)中短期的界限,會(huì)盡可能保持悲觀的狀態(tài)。硬科技有一個(gè)特點(diǎn),別到最后創(chuàng)業(yè)未半中道崩卒,還沒等實(shí)現(xiàn)自己的技術(shù)愿景,反而最后導(dǎo)致自己的經(jīng)營(yíng)上出現(xiàn)問題,所以我們本質(zhì)上建模可能會(huì)傾向于用這種方式,去做公司未來技術(shù)路線的選擇。

在這個(gè)路線下面,我們?nèi)タ慈诵螜C(jī)器人和輪足這樣的形貌,其實(shí)核心的差異點(diǎn)是在于我們對(duì)移動(dòng)和操作這兩個(gè)大問題上,我們到底選擇什么樣的解題思路,一種解題思路是純仿生,另外一種是不單純的仿生,不只仿生,我們傾向于第二個(gè)。從人形的角度來看,當(dāng)然可能有很多人會(huì)說人形會(huì)有很多落地的場(chǎng)景,我們也從來不排斥這樣的觀點(diǎn)和看法,但是我覺得今天的主題也比較好,名人不說暗話,還是虛火過剩的,我還是覺得這個(gè)行業(yè)是很強(qiáng)的。

    張鵬:說的是虛火,一定是今天有什么問題不好解決,大家的熱情可能會(huì)往墻上碰到一些阻礙,你覺得問題主要卡在哪?

張笛:我覺得問題是現(xiàn)在其實(shí)大家對(duì)這個(gè)行業(yè)的關(guān)注是夠的,這是非常好的一件事兒。因?yàn)槿魏我粋€(gè)行業(yè)都需要有一定的show off的能力,讓大家有足夠的傳播點(diǎn),但是問題在大家只關(guān)注到了其中的一方面,大家只關(guān)注機(jī)器人這個(gè)大品類當(dāng)中類人形的一方面,這件事情是不夠健康的。其實(shí)機(jī)器人這個(gè)品類有非常多可以選擇的余地,甚至說仿生、擬人都只是一個(gè)可以選擇的方向,這個(gè)行業(yè)有無限的可能,這就是為什么我們說對(duì)未來無限樂觀,但是對(duì)現(xiàn)在卻保持相對(duì)審慎的態(tài)度,我們覺得機(jī)器人這個(gè)賽道可以走伴生的模式非常多,但是現(xiàn)在似乎有太多狹隘,把所有的精力和資源投在一個(gè)角度上,這就是我們傾向于未來在雙足和輪足上面,我們會(huì)朝著非擬人、非仿生這個(gè)方向探索的一個(gè)主要原因。

張鵬:所以你是相信未必要去擬人,更愿意做超人的一些東西,所以超人的場(chǎng)景和擬人的場(chǎng)景會(huì)多?或者超人比擬人在有些場(chǎng)景里有更好的解法,是可以這么理解的一個(gè)邏輯嗎?

張笛:可以這么理解,而且我覺得最主要的是,擬人作為一個(gè)大行業(yè)的入場(chǎng)券,沒有任何的設(shè)計(jì)參照,開始想盡辦法去開啟一個(gè)行業(yè),這個(gè)起始點(diǎn)非常好。但是隨著一個(gè)行業(yè)的向下發(fā)展,總會(huì)發(fā)現(xiàn),其實(shí)墊腳石下一步踩在哪?英雄老路未必是最優(yōu)解,我們有非常多的思路告訴你,機(jī)器人是新物種,可以完全設(shè)計(jì)一個(gè)新的產(chǎn)品,這個(gè)對(duì)整個(gè)行業(yè)來講是最健康,最有誘惑力,對(duì)我們年輕的人來講也是最有挑戰(zhàn)的方向。

張鵬:張笛是大概四年前,那時(shí)候還是一個(gè)稚嫩的創(chuàng)業(yè)公司,被邀請(qǐng)到極客公園創(chuàng)新大會(huì)的舞臺(tái)上,我們嘗試去點(diǎn)亮,贏得一些關(guān)注?,F(xiàn)在好多了。那我覺得剛才你的觀點(diǎn)很鮮明,我問問石海林總,不是我挑事,但是他剛才說的這個(gè)點(diǎn),也確實(shí)說雙足人形注意力比較集中,這是過去幾年的真相。今天大家也在看不同的形態(tài),你的視角下,為什么人形、雙足這個(gè)事還是對(duì)你們來說是非常關(guān)鍵的點(diǎn)?

  石海林:這個(gè)問題,我們優(yōu)必選作為人形機(jī)器人的先行者以及行業(yè)龍頭,我們會(huì)很務(wù)實(shí)去看人形機(jī)器人,包括雙足輪式,都是屬于人形機(jī)器人,回到這個(gè)問題,我覺得可以從兩方面去看。第一個(gè)我們追根溯源,去看人類為什么是人形的。從大自然還有生物進(jìn)化千百年來看,人之所以成為人形,我們的四肢,我們的手有五個(gè)手指頭,我們的五官在頭上,我們大部分人的眼睛的距離平均在6厘米,為什么大家都是這樣的,其實(shí)背后是因?yàn)檫m應(yīng)了自然環(huán)境和我們?nèi)祟惿鐣?huì)環(huán)境的結(jié)果。

今天我們來看人形機(jī)器人,它去做到人形,其實(shí)更多的不是說我們一定要做到怎么樣,而是說從自然最優(yōu)化的結(jié)果拿到了一些結(jié)論,用在我們?nèi)诵螜C(jī)器人的產(chǎn)品和形態(tài)上,這是第一點(diǎn)。

第二點(diǎn),我覺得更多也是可以從產(chǎn)業(yè)的應(yīng)用場(chǎng)景去看,就以優(yōu)必選我們現(xiàn)在聚焦的工業(yè)場(chǎng)景(來說),人形機(jī)器人現(xiàn)在主要有三大應(yīng)用場(chǎng)景,工業(yè)場(chǎng)景、商業(yè)場(chǎng)景以及家用陪伴場(chǎng)景。后兩個(gè)商用場(chǎng)景和家用場(chǎng)景,因?yàn)檫€有一些交互和情感陪伴的需求,這些需求會(huì)更直接的去對(duì)人形外觀、ID設(shè)計(jì)甚至仿生人形有更高的要求,這些還是比較直接能得出的結(jié)論。從工業(yè)場(chǎng)景來看的話,為什么我們也要去看人形在這個(gè)場(chǎng)景里的優(yōu)化,因?yàn)樵诠I(yè)場(chǎng)景,通過長(zhǎng)期以來的應(yīng)用,我們可以看到有大量的結(jié)構(gòu)化任務(wù),也有更大量的非結(jié)構(gòu)化任務(wù),這些非結(jié)構(gòu)化的任務(wù)從需求出發(fā),去要求產(chǎn)品和功能要具備更強(qiáng)的泛化能力。在我們?cè)诠S看到,各類形形色色的機(jī)械臂各種捶打,但是只能做一些特定的死的任務(wù),而且形態(tài)各異,動(dòng)不動(dòng)4、5米高,特別大。

但我們看到更多的任務(wù),是比如說物流轉(zhuǎn)運(yùn),里面包含了搬運(yùn)、分揀的任務(wù),還有上下料、精密裝配,他們的場(chǎng)景很多是一些狹窄的通道,一些靈巧的柔性的操作,這些對(duì)機(jī)器人的操作更高,泛化能力也更強(qiáng)。比如這些操作、搬運(yùn)、上下料,所以在這些場(chǎng)景需求的催生下,我們會(huì)往人形這個(gè)方向去看。

張鵬:所以還是因?yàn)檫@個(gè)社會(huì)是人構(gòu)建的一個(gè)社會(huì),現(xiàn)有的這種大的商業(yè)環(huán)境也好,工業(yè)的環(huán)境也好,人是重要的生產(chǎn)力主體。所以即便我們要引入新一代的生產(chǎn)力,最好還是別面臨根本性的改造,人是不是能被替代,這個(gè)是容易思考。是不是還有一個(gè)數(shù)據(jù)的維度,最近也聽到一個(gè)視角,人形是因?yàn)樗菀鬃鰯?shù)據(jù)遷移,我拿去做遙操也好,或者采集這樣的數(shù)據(jù),它在數(shù)據(jù)的循環(huán)上跑得更好,這個(gè)也是你們感知到,真的存在這樣的效率優(yōu)勢(shì)嗎? 

石海林:對(duì)的,人形數(shù)據(jù)相對(duì)其他形態(tài)的數(shù)據(jù)更容易采集獲取、標(biāo)注清洗。以遙操作采集為例,如果設(shè)備與人形,比如手部、雙臂,是同樣的甚至同構(gòu)的,那么操作員操作起來會(huì)更高效便捷,同時(shí)培訓(xùn)一個(gè)數(shù)量的操作員也更簡(jiǎn)單容易。 

    張鵬:我這里再補(bǔ)充問兩位同樣的問題,大家簡(jiǎn)短地說一下你們的判斷邏輯。因?yàn)楝F(xiàn)在大家討論,可能輪足更是這樣,它是未來設(shè)計(jì)通用的東西,還是未來通用的基座加不同的任務(wù)包、任務(wù)能力,分散到不同的場(chǎng)景適配會(huì)更好?人形現(xiàn)在看起來,好像大家都走了通用的概念,會(huì)不會(huì)未來它是一個(gè)底盤加應(yīng)用,還是未來就是一個(gè)統(tǒng)一的啥都能干? 

張笛:其實(shí)本末科技在觀察行業(yè)生態(tài)時(shí)有很多發(fā)現(xiàn),因?yàn)槲姨岬?,我們公司是平臺(tái)化的機(jī)器人供應(yīng)商,我們是有關(guān)鍵技術(shù)去服務(wù)客戶。在這個(gè)過程中我們發(fā)現(xiàn)整個(gè)具身智能大的方向可以分兩類,按照張總講的分類方法,但我們的叫法會(huì)叫成學(xué)院派和產(chǎn)業(yè)派,其實(shí)相差最主要的點(diǎn),學(xué)院派是自上而下,以通用為大旗,去把所有的相關(guān)的技術(shù)去做推廣和積累,但產(chǎn)業(yè)派就是循序漸進(jìn)去做通用,本質(zhì)上就是一個(gè)基座上面疊加模組。這兩個(gè)一個(gè)是自下而上,一個(gè)是自上而下,但是我們從統(tǒng)計(jì)上來看,產(chǎn)業(yè)派的速度和市場(chǎng)化的速度確實(shí)沒那么快,假如大家認(rèn)可,以底層的通用化平臺(tái)加各種各樣的功能模組逐漸去做通用這件事,是一條通向具身智能的道路的話,現(xiàn)在從商業(yè)化的角度,還是產(chǎn)業(yè)化會(huì)推動(dòng)得更快一點(diǎn)。 

   張鵬:石海林你怎么看? 

 石海林:我完全認(rèn)同張笛總的觀點(diǎn),在產(chǎn)業(yè)派這一塊,我們自下而上從場(chǎng)景任務(wù)出發(fā),構(gòu)建海量的數(shù)據(jù),以及基于算力的一些資源和優(yōu)勢(shì),去快速把學(xué)術(shù)界從上而下的基座模型應(yīng)用在具體各類場(chǎng)景中。而且這個(gè)周期我們認(rèn)為是一個(gè)絕對(duì)的加速化的過程,因?yàn)槲覀兛吹剑热缡畮啄昵拔覀冋f做智能化,那個(gè)時(shí)候是做感知智能,如果我們比如以AlexNet作為標(biāo)志物,作為開端,到2022年,比如說那會(huì)兒ViT作為一個(gè)成熟標(biāo)志的話,從發(fā)展到成熟感知智能花了十年時(shí)間。但是在感知智能的下一階段,交互智能如果我們以17年transformer出現(xiàn)為開端,到它成熟期,比如說正好三年前ChatGPT發(fā)布作為一個(gè)成熟標(biāo)志的話,這個(gè)過程從十年加速到了五年。那我們今天來看具身智能這一塊,如果我們以ALOHA為代表,他打通了Neural Network在具身智能這一塊的技術(shù)方案。所以我們可以把2023年作為起始點(diǎn)的話,假設(shè)我們也是以最保守5年來估計(jì),從23年到28年,今天來算的話可能就三年,或者18個(gè)月,就已經(jīng)進(jìn)入到成熟期,這個(gè)周期是大大加快。 

張鵬:剛才這兩位聊了聊在形態(tài)上面和發(fā)展路徑上可能的預(yù)期,我問問黃總,因?yàn)槟銈儙准腋闶澜缒P停澜缒P驮谥邱{領(lǐng)域,到底現(xiàn)在能解決什么問題,還有什么問題有待解決?能不能給我們一個(gè)比較清晰的技術(shù)進(jìn)展和世界觀?

黃冠:我覺得這個(gè)問題提得特別好,像“世界模型”“空間智能”這些概念都備受關(guān)注。大家探討其在內(nèi)容創(chuàng)作、自動(dòng)駕駛以及具身智能等領(lǐng)域的應(yīng)用時(shí),我想先講講我個(gè)人對(duì)世界模型對(duì)具身智能領(lǐng)域價(jià)值的一些看法。

我認(rèn)為世界模型是物理AGI最后的瓶頸,并且它不是要5年、10年被攻克掉,實(shí)際上我們已經(jīng)看到了它被解決的曙光,得益于整個(gè)生成式AI的發(fā)展,這是我對(duì)整個(gè)世界模型大的看法。

更具體,世界模型對(duì)具身智能的價(jià)值是全方位的。其實(shí)我們講一個(gè)具身模型,無非就是講數(shù)據(jù)來源、學(xué)習(xí)范式,以及模型架構(gòu)。世界模型在這三方面都有非常高的價(jià)值,首先數(shù)據(jù)來源,如果具身智能僅僅依賴真實(shí)機(jī)器和傳統(tǒng)仿真這兩種方式,可能會(huì)存在比較大的瓶頸。真機(jī)要采集到足夠的數(shù)據(jù)極其困難,基于規(guī)則構(gòu)建的傳統(tǒng)仿真上限也比較受限。而世界模型提供了一種非常高效生成世界的方式,雖然它目前并不完美,但已經(jīng)展現(xiàn)出巨大的價(jià)值,它是一個(gè)數(shù)據(jù)引擎,能夠?yàn)榫呱碇悄芴峁o限的所需的數(shù)據(jù)。

第二個(gè)是在學(xué)習(xí)范式上,模仿學(xué)習(xí)很有價(jià)值但是遠(yuǎn)遠(yuǎn)不夠,強(qiáng)化學(xué)習(xí)如果只是依賴真實(shí)環(huán)境去做,也是很低效的,包括大家現(xiàn)在看到Pi0.6 star,雖然已經(jīng)進(jìn)步很大了,但仍然高度依賴真實(shí)環(huán)境;而世界模型實(shí)際上為強(qiáng)化學(xué)習(xí)提供了一個(gè)非常好的閉環(huán)環(huán)境,它是能夠被action驅(qū)動(dòng)的,來預(yù)測(cè)未來環(huán)境變化的模型。 

 張鵬:是能擺脫真實(shí)世界以光速進(jìn)化的環(huán)境。 

 黃冠:對(duì),所以我們叫它是可以Scale(英)的強(qiáng)化學(xué)習(xí),這是它作為模擬器的第二點(diǎn)價(jià)值。第三點(diǎn)就是更本質(zhì)了,叫做世界行動(dòng)模型,可以替代VLA,L為什么會(huì)對(duì)action一定必須呢?我們過去做自動(dòng)駕駛也沒有語言,所以VLA依賴這個(gè)L問題是很大的,要真正實(shí)現(xiàn)智能,就得邁向世界行動(dòng)模型,所以我認(rèn)為這三個(gè)點(diǎn)的價(jià)值都會(huì)非常大。

目前行業(yè)進(jìn)展上,在上面三個(gè)方面,無論是我們的一些工作,還是全球的包括像Cosmos很多一些工作,世界模型都已經(jīng)開始大規(guī)模的產(chǎn)生價(jià)值了。這是我對(duì)世界模型和具身智能關(guān)系的理解。 

張鵬:很有意思,因?yàn)槭澜缒P偷某霈F(xiàn)就是因?yàn)樵诰呱眍I(lǐng)域里面數(shù)據(jù)這個(gè)事比較頭疼,但是既然說世界模型是模型,只要是模型,都存在數(shù)據(jù)問題,所以世界模型的數(shù)據(jù)這個(gè)事就有點(diǎn)死循環(huán),你怎么看這個(gè)事? 

黃冠:這兩個(gè)問題都問得非常好,我還是思考一下,我可能這樣回答。我跟大家介紹一下,第一個(gè)是各個(gè)模型的關(guān)系,我們講三個(gè)模型,語言模型、世界模型、行動(dòng)模型。語言模型輸出的是語言,世界模型輸出的是對(duì)未來世界的預(yù)測(cè),未來的世界可以用video去表示,可以用3D去表示,當(dāng)然也可以把physics表示進(jìn)去。第三個(gè)行動(dòng)模型輸出的是action。所以這是三個(gè)非常不同的模型。

第二個(gè),為什么語言模型跟世界模型其實(shí)可能相比行動(dòng)模型會(huì)好解決呢?就是因?yàn)閿?shù)據(jù)多,大家都知道,語言模型有互聯(lián)網(wǎng)上的海量文字?jǐn)?shù)據(jù)作為支撐。而世界模型所依賴的數(shù)據(jù)中,互聯(lián)網(wǎng)的視頻數(shù)據(jù)是最重要和基礎(chǔ)的部分,這些視頻數(shù)據(jù)看似沒有直接呈現(xiàn)三維(3D)和physics,但實(shí)際上3D和physics都隱含在視頻的隱空間里了。大家看互聯(lián)網(wǎng)上的視頻,比如一個(gè)水杯被扔出去,這其中就蘊(yùn)含了非常豐富的物理規(guī)律。所以視頻數(shù)據(jù)其實(shí)是一個(gè)非常好的構(gòu)建世界基礎(chǔ)模型(world foundation model)的素材來源,雖然它并不完備,但是一個(gè)非常好的基礎(chǔ)。而我們最不缺的就是互聯(lián)網(wǎng)上記錄的海量的視頻數(shù)據(jù)。所以,語言模型和世界模型能夠更高效地利用豐富的語言和視頻數(shù)據(jù),進(jìn)而作為行動(dòng)模型的基礎(chǔ)。

第三點(diǎn),我最近也思考很多,為什么智駕和具身可能不太一樣,在智駕里面,大家之前沒有所謂的VLA,沒有世界模型,但也干得還不錯(cuò)。包括中午體驗(yàn)的地平線的一段式端到端,真的非常絲滑,為什么?因?yàn)橹邱{有大量數(shù)據(jù),只要數(shù)據(jù)足夠多,可以不依賴語言模型和世界模型,只需要場(chǎng)景的端到端駕駛數(shù)據(jù)就好。當(dāng)然,最后加上VLA和世界模型,會(huì)讓系統(tǒng)的推理能力更強(qiáng),迭代更高效。但是具身模型你會(huì)發(fā)現(xiàn),如果從頭做一個(gè)VA的端到端模型,是基本不可能的,核心是因?yàn)榫呱眍I(lǐng)域太缺數(shù)據(jù)了,這會(huì)導(dǎo)致駕駛模型和具身模型非常不一樣的發(fā)展路徑。 

張鵬:這個(gè)問題我再往下延伸一下,問問李教授,大語言模型其實(shí)給了我們所謂的scaling law這樣的思維,不管今天大家說這個(gè)AGI這條路上scaling law有沒有撞墻,但反正有大部分人還沒有放棄,還在無限往上堆算力,還在各種的造數(shù)據(jù)對(duì)吧?在具身領(lǐng)域里邊大概率可能也要scaling something,對(duì)吧?聽起來今天我們的數(shù)據(jù)不夠,也是因?yàn)槲覀兤鋵?shí)想用這個(gè)scaling law想套進(jìn)去,但是數(shù)據(jù)還是有一些問題。所以我剛才提到了世界模型等相關(guān)內(nèi)容。但從您的角度來去看,就是這種在最深領(lǐng)域的scaling law和scaling what會(huì)跟大語言模型所遵循的規(guī)模法則,未來有什么不一樣的點(diǎn)?又會(huì)有什么新的可能性?這個(gè)我其實(shí)挺感興趣的,因?yàn)槲矣X得不會(huì)完全一樣。 

李弘揚(yáng):這個(gè)我嘗試回答一下這個(gè)問題,這個(gè)問題還是問得非常前沿的,首先有個(gè)結(jié)論,具身智能領(lǐng)域一定會(huì)有scaling law,到目前為止真正能算得上,做過scaling law實(shí)驗(yàn)的,這個(gè)世界上只有一家公司,就是Generalist AI,前一陣的Gen-0。其余包括Physical intelligence(Pi),都沒有很大規(guī)模的用scaling law的實(shí)驗(yàn),都還談不上scaling law。所以你問的下一個(gè)問題,如果真有規(guī)模法則(scaling law),它會(huì)和大語言模型的規(guī)模法則呈現(xiàn)怎樣的情況呢?

其實(shí)大概率還是沿著一種冪律分布的,或者說是線性的,無論是指數(shù)級(jí)還是線性的增長(zhǎng)的趨勢(shì),這里面我想說一下,因?yàn)镚en-0這個(gè)工作一周積累30個(gè)小時(shí),300萬條數(shù)據(jù)(有效的軌跡),我們大概也換算了一條,如果兩班倒的話,采集這個(gè)不同的manipulation task,一班8個(gè)小時(shí),16個(gè)小時(shí),其實(shí)有效的轉(zhuǎn)化率是4、5個(gè)小時(shí),因?yàn)檫€要涉及到數(shù)據(jù)質(zhì)檢、熟悉的過程等。這樣的話需要Aloha或者說主從臂這樣的一套設(shè)備需要500套,很顯然它不可能部署500套,所以肯定要走UMI等等這種低成本的路線。在具身領(lǐng)域大家都在談?wù)摂?shù)據(jù)金字塔、真機(jī)數(shù)據(jù)等概念,我覺得從算法、數(shù)據(jù)、硬件以及法律這幾個(gè)維度來看,如何構(gòu)建一套高效的數(shù)據(jù)采集系統(tǒng),在具身智能領(lǐng)域是非常關(guān)鍵,然后我們?cè)賮碚fscaling law這個(gè)事。 

  張鵬:現(xiàn)在要Scaling,獲取合適的原料是重要的問題,我們只能用Scaling Law的驅(qū)動(dòng)有效解決前面的原料問題,這反而是產(chǎn)業(yè)今天關(guān)注的重點(diǎn),要不然具身智能這個(gè)智能水平?jīng)]法快速往上漲,這是很現(xiàn)實(shí)的,得到教授的親自認(rèn)證,看來這是關(guān)鍵的問題。

這時(shí)候轉(zhuǎn)到黃冠這了,你看我們過去AI1.0的時(shí)候,ImageNet的出現(xiàn)對(duì)CV有重大的幫助,在具身智能里面,所謂的ImageNet時(shí)刻優(yōu)化到什么樣,會(huì)面臨一個(gè)ImageNet的時(shí)刻,讓這個(gè)技術(shù)線快速的成長(zhǎng)?這里面可能也會(huì)有一些真數(shù)據(jù)收集等,從你的角度怎么去看?會(huì)有ImageNet的時(shí)候嗎? 

黃冠:我覺得很可能不會(huì)有ImageNet時(shí)刻,因?yàn)閳D像分類任務(wù)很標(biāo)準(zhǔn)化,給一張圖片給了一個(gè)標(biāo)簽就行;但是具身機(jī)器人,所有的傳感器、執(zhí)行器、環(huán)境、物體都不一樣,本體也不一樣,具身不是打造一個(gè)數(shù)據(jù)集的問題。所以我認(rèn)為具身領(lǐng)域可能不會(huì)存在ImageNet的時(shí)刻,而是會(huì)直接到chatgpt時(shí)刻。

并且我們其實(shí)覺得沒那么遙遠(yuǎn),最近硅谷密集的出來一波公司,已經(jīng)積累了10萬小時(shí)以上的真機(jī)數(shù)據(jù)。所以可能明年很關(guān)鍵,明年全球可能會(huì)有5-10家公司,會(huì)把數(shù)據(jù)的量至少做到百萬小時(shí)的級(jí)別(當(dāng)然這里面大家數(shù)據(jù)來源的分布可能會(huì)不一樣),可能會(huì)有公司接近GPT-3時(shí)刻。所以其實(shí)我們對(duì)ChatGPT時(shí)刻也不用那么悲觀,就像凱哥開場(chǎng)的時(shí)候講的,可能具身三五年時(shí)間就進(jìn)入家庭場(chǎng)景了。 

張鵬:你覺得他又保守了? 

 黃冠:我們其實(shí)更樂觀,因?yàn)檫@個(gè)行業(yè)很卷,只要大家意識(shí)到可以做,只要資源投入到位,就沒有那么大瓶頸,無論是數(shù)據(jù)獲取、模型架構(gòu),還是具身本體研發(fā),只需要時(shí)間,需要投入。明年可能會(huì)接近GPT-3的時(shí)刻,兩三年之內(nèi)有機(jī)會(huì)到ChatGPT時(shí)刻。 

張鵬:這個(gè)問題李教授也幫我們部署一下,你怎么看?我覺得真機(jī)數(shù)據(jù)當(dāng)然很好,但是問題要有真機(jī)數(shù)據(jù),要有足夠多的機(jī)器,足夠多的場(chǎng)景跑起來。所以你的樂觀程度怎么樣?

李弘揚(yáng):我沒有那么樂觀,跟黃總差不多,所以還是要遵循這個(gè)數(shù)據(jù)金字塔或者說pyramid的這種形式。互聯(lián)網(wǎng)數(shù)據(jù),即ego- centric data,加上simulation,加上遙操等等這些,互為補(bǔ)充吧。 

張鵬:網(wǎng)絡(luò)數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)就一個(gè)data,然后再加上simulation,再加上遙操等等這些互為補(bǔ)充。所以這件事兒還是要把所有可用的數(shù)據(jù)都要用起來,合在一起。今天其實(shí)不管怎么說,至少在這個(gè)時(shí)刻我們還不能說,具身這個(gè)領(lǐng)域從數(shù)據(jù)也好,還是從它的本身,我們希望它的智能的能力也好,已經(jīng)到了一個(gè)讓我們所有人都覺得ready的這樣一個(gè)狀態(tài)。但我們面臨一個(gè)現(xiàn)實(shí)的問題,我看今天大量的公司也在考慮C端的事,甚至凱哥以未來家庭機(jī)器人未必不可以,我發(fā)現(xiàn)兩年前他還沒有跟我說這句話,現(xiàn)在大家反而比較樂觀。那我問問張笛,往C端走,今天你的機(jī)器人還沒有到那么通用的能力,怎么才能實(shí)現(xiàn)走進(jìn)千家萬戶?還有哪些關(guān)鍵節(jié)點(diǎn)?即便現(xiàn)在還沒到通用,就像ChatGPT還不能叫AGI,但是確實(shí)實(shí)現(xiàn)了千家萬戶,如果到具身機(jī)器人領(lǐng)域,真的怎么從C端走進(jìn)千家萬戶,有足夠的量? 

張笛:剛才大家提到兩個(gè)觀點(diǎn),一個(gè)是學(xué)院派,一個(gè)是產(chǎn)業(yè)派,一個(gè)是一口吃成個(gè)胖子,把通用實(shí)現(xiàn),另外一個(gè)是循序漸進(jìn)做通用。我們自己的觀察,現(xiàn)在走進(jìn)千家萬戶的具身機(jī)器人已經(jīng)非常多了,甚至是在幾百萬到上千萬以上這個(gè)數(shù)量級(jí)。

我們可以舉一些例子,什么叫循序漸進(jìn)的走向通用。當(dāng)某一天我們?cè)诩依锩婵吹阶约旱膾叩貦C(jī)器人除了掃地以外,突然之間有了安防巡檢的功能的時(shí)候,它就向通用邁出一步。當(dāng)它有了安防巡檢之后,又有一定的家居物品要維護(hù)的時(shí)候,它又向前走了一小步,但有一天總會(huì)有一個(gè)時(shí)刻,大家會(huì)忽然驚訝的發(fā)現(xiàn),原來我家里的小機(jī)器人能干的事情竟然越來越多,竟然變成這個(gè)樣子,竟然解決的問題已經(jīng)不再是我當(dāng)時(shí)一開始覺得它的這個(gè)樣子了,這是一個(gè)產(chǎn)品系列,這是它在怎么樣去逐漸走向通用的過程。

而且同時(shí),我們家用的小型清潔機(jī)器人廠商,一開始瞄準(zhǔn)的是室內(nèi)的場(chǎng)景,后續(xù)就會(huì)逐漸的希望我的機(jī)器人從室內(nèi)走出去,可以從室內(nèi)走上電梯里,可以走向自己家的草坪,可以走向街區(qū)。對(duì)于企業(yè)而言,要實(shí)現(xiàn)產(chǎn)品這樣循序漸進(jìn)地走向通用化,究竟該如何推進(jìn)呢?這兩個(gè)力量都可以讓一個(gè)行業(yè)從一開始對(duì)一個(gè)功能性的產(chǎn)品,從一個(gè)簡(jiǎn)單的功能性的產(chǎn)品的期待,到逐步轉(zhuǎn)變?yōu)閷?duì)能帶來更優(yōu)質(zhì)體驗(yàn)產(chǎn)品的期待。這樣的循序漸進(jìn)過程我覺得已經(jīng)正在發(fā)生,而且如火如荼,甚至正在加速發(fā)生。 

張鵬:聽起來你的思路是,哪怕就是一個(gè)服務(wù)或者一種用戶價(jià)值的兌現(xiàn),就像掃地機(jī)器人專注于把地面清潔做好,僅這一項(xiàng)功能,在家庭用戶市場(chǎng)就能達(dá)到上千萬臺(tái)的年銷量,在此基礎(chǔ)上,你逐漸增加它的任務(wù)能力,當(dāng)然它的服務(wù)形態(tài)也可能發(fā)生變化。所以,對(duì)于面向家庭用戶的產(chǎn)品而言,發(fā)展的路徑是一條條地履行服務(wù)承諾、有效實(shí)現(xiàn)用戶需求,而不是像Iphone一樣,一出現(xiàn)大家全都買了。 

張笛:也不完全是這樣,一定是量變帶來質(zhì)變,在逐漸的履約的過程,現(xiàn)在的量變還不能引起質(zhì)變,還沒到那個(gè)關(guān)鍵節(jié)點(diǎn),沒到那個(gè)turning point,就像傳統(tǒng)的功能機(jī)時(shí)代,先有BP機(jī),再有大哥大,最后能發(fā)短信,有彩鈴,同時(shí)有PDA,最后有一個(gè)大屏做整體的匯總,同時(shí)又能上網(wǎng),又能聽音樂。 

張鵬:所以最后還得是Iphone時(shí)刻。 

張笛:對(duì),現(xiàn)在我們處在前夜的狀態(tài)。 

張鵬:終于可以問王叢了,王叢你們作為一個(gè)技術(shù)團(tuán)隊(duì),大家在相關(guān)領(lǐng)域做創(chuàng)新,有什么crazy idea,你們能看到哪些能干、哪些不能干,能不能跟我們分享一下,今天機(jī)器人越炒越熱,都說進(jìn)入家庭,怎么進(jìn),今天是什么狀況,你看到的幫我們解謎一下。 

王叢:如果我們現(xiàn)在說具身能做很多東西的肯定是在家庭用戶場(chǎng)景,但問題是都做不出來。張笛哥說的我很認(rèn)同,真的做消費(fèi)電子的這幫人都很務(wù)實(shí),都一定是價(jià)格成本對(duì)應(yīng)PMF(市場(chǎng)匹配度)的價(jià)值,一定是找到它的一個(gè)很匹配的點(diǎn),這個(gè)東西才有可能在C端跑出來。C端跑出來的東西絕對(duì)不是一個(gè)價(jià)格偏高,PMF(市場(chǎng)匹配度)沒有的東西,所以C端消費(fèi)電子產(chǎn)品的功能一定是一點(diǎn)點(diǎn)積累的,其實(shí)Iphone也是功能積累起來的。

Iphone如果大家看喬布斯的發(fā)布會(huì),其實(shí)就是通訊、MP3加上一個(gè)電話,三個(gè)已有功能整合到了一個(gè)產(chǎn)品上,然后慢慢構(gòu)建起一個(gè)生態(tài)系統(tǒng),從而有了所謂的智能手機(jī)。但是其實(shí)在Iphone之前的諾基亞也有不同的軟件,也叫智能機(jī),其實(shí)我覺得消費(fèi)電子一定還是回歸到最本身的產(chǎn)品需求,一點(diǎn)點(diǎn)疊功能發(fā)展出來,所以包括我們國(guó)內(nèi)很多客戶,就像掃地機(jī)最初只是負(fù)責(zé)平面的清潔,這件事情它的價(jià)格空間就已經(jīng)被定死了,因?yàn)樗褪堑孛娴那鍧?,就算把掃地機(jī)器人掃到90分、95分、100分,它的價(jià)格永遠(yuǎn)是那樣,除非它變成一個(gè)空間清潔,但即便如此價(jià)格空間也有限,因?yàn)檎?qǐng)個(gè)阿姨也就40、50塊錢一小時(shí),家庭清潔就三個(gè)小時(shí)家里都打掃一遍,其實(shí)它的價(jià)格也定死了,一定要找到那個(gè)關(guān)鍵增長(zhǎng)點(diǎn)才能爆發(fā)。 

張鵬:追問一點(diǎn),就像你說的清潔這個(gè)事,因?yàn)橛鞋F(xiàn)實(shí)世界的服務(wù)在那了,那情緒價(jià)值這個(gè)事情,你認(rèn)為清潔機(jī)器人真的會(huì)解決事情,而不是解決物理的狀態(tài)?你看好嗎? 

王叢:情緒機(jī)器人這個(gè)事情我是很看好,但是它并不是嚴(yán)格意義上的價(jià)值,因?yàn)槊總€(gè)人,男人、女人、小孩、老人,每個(gè)人定義陪伴、定義情緒的概念太非標(biāo)了,所以你很難定義出來一個(gè)所謂的陪伴機(jī)器人。陪伴什么?我覺得這不是一個(gè)以場(chǎng)景定義產(chǎn)品的思路,真正好的產(chǎn)品定義,應(yīng)該是當(dāng)我想到某一個(gè)特定場(chǎng)景時(shí),就能立刻聯(lián)想到對(duì)應(yīng)的產(chǎn)品;同時(shí),當(dāng)我看到某個(gè)產(chǎn)品時(shí),也能馬上明確它要解決的是哪個(gè)具體場(chǎng)景的問題。所以大家看很多產(chǎn)品不能推廣,或者做的idea很好,但是賣不出去,雖然我覺得情緒機(jī)器人是個(gè)好東西,但是它一定要對(duì)應(yīng)到不同細(xì)分的場(chǎng)景當(dāng)中,大家才能進(jìn)一步去談這個(gè)問題。 

 張鵬:因?yàn)閽叩剡@個(gè)事定義場(chǎng)景就好,不用定義用戶,但是一到情緒價(jià)值了,它既要有場(chǎng)景,又要有用戶,就變成兩個(gè)不確定的模式,那算起來就麻煩了。這也是一個(gè)挑戰(zhàn)。

我再追問一下,這也是我們整個(gè)下午的論壇可以感受到,其實(shí)具身智能機(jī)器人這個(gè)領(lǐng)域,大家都在講全棧自研,但我覺得你們今天選擇了一個(gè)生態(tài)開放這樣的邏輯。未來這個(gè)里面有錢的巨頭都全棧自研了,那你們?yōu)槭裁催x擇后面進(jìn)來的兄弟們,你們要成為給他們搭臺(tái)的人?這個(gè)戰(zhàn)略選擇是怎么做出來的? 

王叢:我覺得這個(gè)選擇既有感性的一面,也有理性的一面。先說說感性的:任何一家公司做事情,創(chuàng)始人、CEO 都會(huì)有對(duì)未來的畫面感 —— 地瓜機(jī)器人的畫面感是什么?或者說,什么事能讓我們這幫人發(fā)自內(nèi)心地開心?不是我們自己做出一個(gè)多智能、多厲害的機(jī)器人,而是看到各行各業(yè)的消費(fèi)電子、智能硬件,都能通過我們的技術(shù)賦能實(shí)現(xiàn)智能化,這才是我幻想中的畫面,也是能讓我們真正開心的事 —— 這是感性層面的原因。

我覺得機(jī)器人行業(yè)就算發(fā)展十年,也依然會(huì)是非標(biāo)市場(chǎng) —— 各行各業(yè)的機(jī)器人本體形態(tài),大概率都會(huì)不一樣。哪怕幾年以后人形機(jī)器人變得非常泛化、智能,我也無法理解 “用幾十萬的人形機(jī)器人來掃地” 這件事 —— 大家看的科幻電影里,未來是各種各樣的機(jī)器人各司其職,我覺得現(xiàn)實(shí)的未來也會(huì)是這樣。機(jī)器人這件事情就是它很非標(biāo),它的場(chǎng)景很碎,它并不是一個(gè)寡頭壟斷的市場(chǎng),那我覺得這個(gè)時(shí)代是需要有一家公司去把底層的一些東西給做好,才能真的加速這個(gè)時(shí)代的到來。雖然說這是我們的立場(chǎng),但我覺得未來機(jī)器人公司有很多自研的,有很多會(huì)選擇擁抱像地瓜這樣的供應(yīng)商,有很多公司會(huì)自研,這個(gè)太正常了。歷史這么多年,每個(gè)行業(yè)都會(huì)有這樣的分化:全棧自研的公司,比如蘋果,是非常偉大的公司;擁抱生態(tài)開放的公司,比如英偉達(dá),也是非常偉大的公司。所以世界是多元的,兩種路線都對(duì),只是我們感性上的追求,讓我們選擇了生態(tài)開放這一端。 

張鵬:對(duì),我覺得沒有對(duì)錯(cuò),都是選擇。但是毫無疑問,如果只有一種,反而可能是不對(duì)的,這倒是一個(gè)挺好的邏輯,如果只有一種,那你做另一種,大概率是正確的,世界從來不會(huì)那么單一,這個(gè)視角很給人啟發(fā)。

我再問問李老師,你們一個(gè)百萬級(jí)的數(shù)據(jù)開源了,剛才我們一直說數(shù)據(jù),數(shù)據(jù)很珍貴,那開源這件事背后的意圖是什么?或者說你覺得未來在具身智能領(lǐng)域里面的開源,有機(jī)會(huì)怎么推動(dòng)這個(gè)行業(yè)的技術(shù)框架往下發(fā)展?這方面你可能有些思考。 

李弘揚(yáng):感謝,首先要嚴(yán)謹(jǐn)說明,“全球首個(gè)” 是智元的宣傳表述,學(xué)術(shù)上還是要謹(jǐn)慎,畢竟說 “the very first” 很容易被人攻擊。其實(shí)最開始 2023 年我就和姚卯青合計(jì)這個(gè)事,2024 年的時(shí)候智元還處在比較早期的階段,但他能有這樣的雄心壯志 —— 在上海張江有2000平的數(shù)采場(chǎng),而不是在大學(xué)實(shí)驗(yàn)室的簡(jiǎn)單的 pick-and-place,這一點(diǎn)才是最打動(dòng)我的。后來才有了現(xiàn)在這樣的體量,包括我前兩天去那個(gè)數(shù)采廠,都已經(jīng)需要訪客門禁了,能看出來規(guī)模確實(shí)起來了。

這個(gè)百萬真機(jī)數(shù)據(jù)集,至少現(xiàn)在回過頭來看,可以用于預(yù)訓(xùn)練、世界模型的訓(xùn)練,能給那些沒有海量數(shù)據(jù)的高校實(shí)驗(yàn)室提供一個(gè)很好的平臺(tái)。但其實(shí)我們最近也在復(fù)盤,這樣的模式能不能復(fù)制?畢竟像agibot world這樣的數(shù)據(jù)集,買過來成本也不低,還需要一套完整的生態(tài),上到云服務(wù)的支撐等等,都得配套。所以在這之后,開源開放的數(shù)據(jù)集其實(shí)挑戰(zhàn)還是蠻多的,可能最后還是需要一個(gè)行業(yè)和眾力共建的平臺(tái)來牽引,搭建一個(gè)統(tǒng)一的真機(jī)測(cè)試場(chǎng),而不是單純靠一家的數(shù)據(jù)集獨(dú)大,這樣的生態(tài)會(huì)更合適一些。 

張鵬:毫無疑問,在數(shù)據(jù)這件事上,匯成一個(gè)大河流,我覺得它可能對(duì)產(chǎn)業(yè)的發(fā)展有意義。但是它需要有合理的地形完成這件事,所以這個(gè)事我們其實(shí)挺期待,因?yàn)榻裉鞂W(xué)術(shù)領(lǐng)域在這種迅速形成超級(jí)共識(shí)的賽道里面反而挺難受的,最多的錢都不給你們,是不是存在這樣的問題?所以我覺得這種東西還是很期待更多的產(chǎn)業(yè)合作出現(xiàn)??赡芪野炎詈笠?part 的問題往前推一推,因?yàn)槲覀冋f了情緒價(jià)值,也說了陪伴,王叢說了一點(diǎn)我很認(rèn)同,陪伴這個(gè)是很寬泛的,怎么陪伴,我還是問一下張笛,真的把這些東西放在家里,陪伴,情緒價(jià)值,還是存在一些細(xì)分賽道,哪怕王叢說我們要加給用戶,但是真的來說可能也能對(duì)齊,不知道從你的角度怎么看?你的機(jī)器人帶著靈動(dòng)勁就很討喜,所以你這方面身邊朋友做這個(gè)的挺多,你怎么看?怎么從陪伴機(jī)器人找到細(xì)分的賽道,真的完成幾十萬臺(tái)、上百萬臺(tái)的銷售,你會(huì)看好嗎? 

 張笛:其實(shí)我覺得我的綜合判斷跟王叢哥講得比較類似,情緒價(jià)值這個(gè)事情怎么定義產(chǎn)品,其實(shí)是非常非常需要去仔細(xì)斟酌的一個(gè)方向,純粹的情緒需求把它翻譯成商業(yè)需求的語言,肯定是能夠去做的。不管你是孤獨(dú)也好,甚至孤獨(dú)也可以分成若干種,解決不同的孤獨(dú),可能會(huì)有不同的產(chǎn)品形式可以去做,這個(gè)時(shí)候你發(fā)現(xiàn)情緒需求并不依賴于一個(gè)全能的機(jī)器人,只要針對(duì)那樣專門的情緒需求定向去設(shè)計(jì)產(chǎn)品,這是我覺得最合理,也是最容易去取得一些市場(chǎng)進(jìn)展的方式和方法。

這幾年我們?cè)谟^察整個(gè)市場(chǎng),包括我們也服務(wù)了非常多的客戶,這個(gè)過程當(dāng)中我們也看到,確實(shí)還是有一些情緒需求,可以靠這些能移動(dòng)的機(jī)器人,或者不能移動(dòng)的對(duì)話終端,來去解決,進(jìn)而形成一個(gè)比較穩(wěn)定的市場(chǎng),也能形成一個(gè)未來有機(jī)會(huì)逐漸走向通用的這樣的minimal available product(英),這些市場(chǎng)包括我們現(xiàn)在能看到方興未艾的一些小型的、甚至不能移動(dòng)的對(duì)話終端 —— 如果我們把具身智能列一個(gè)九宮格,橫軸看是否與物理世界產(chǎn)生接觸,縱軸是它到底要不要使用非常非常 fancy 的機(jī)器人算法,那這類對(duì)話終端其實(shí)就屬于 “不接觸物理世界、僅依賴 NLP 算法” 的類別,它確實(shí)也已經(jīng)在具身這個(gè)賽道下面,扎扎實(shí)實(shí)定義出了一個(gè)minimal availbable product,這是一個(gè)方向。

另外,在能運(yùn)動(dòng)的機(jī)器人品類里面,我們也發(fā)現(xiàn)現(xiàn)在非常多小型的桌搭產(chǎn)品,開始逐漸疊加越來越多的新功能和新范式,而且這些桌搭產(chǎn)品里,情緒價(jià)值往往高過實(shí)用功能。那這樣的桌搭產(chǎn)品,甚至是純玩具類型的產(chǎn)品里面,其實(shí)也有機(jī)會(huì)跑出商業(yè)化路徑。既然已經(jīng)它是有MVP的這樣的一個(gè)minimal available的這樣的一個(gè)小市場(chǎng)了,那其實(shí)依然有機(jī)會(huì)在通用化的道路上越走越遠(yuǎn)。

張鵬:所以具身這個(gè)概念大家不要都把它想成最高精尖,不是所有東西都是為了技術(shù)突破,反而你要服務(wù)用戶的時(shí)候,也許你并不需要實(shí)體形態(tài),哪怕是個(gè) “幽靈機(jī)器人”—— 沒有實(shí)體,只交付情緒價(jià)值,那在九宮格里面就屬于比較極端的一個(gè)定點(diǎn),它是一個(gè) ghost without shell 對(duì)吧?這個(gè)其實(shí)都是有可能的,反而我覺得要開放性思維去看這件事,最終還是服務(wù)用戶的核心需求。我覺得收尾的工作還是問問石海林,最近你看小黃他們搞的人形機(jī)器人,大家忽然發(fā)現(xiàn)一點(diǎn),這個(gè)人形越來越像人了,甚至太擬人了。

首先一點(diǎn),這種東西確實(shí)帶給人親近感,但是這種離人越來越近,甚至從形態(tài)上無限貼近人類的設(shè)計(jì),如果真的未來進(jìn)入家庭的時(shí)候,等于家里出現(xiàn)一些 “非人但又很類人” 的東西 —— 優(yōu)必選做人形機(jī)器人很多年了,我相信你們除了技術(shù)研發(fā),也會(huì)思考一些社會(huì)學(xué)、倫理方面的東西。有沒有思考過這個(gè)問題?當(dāng)那么類人的東西出現(xiàn)在家庭場(chǎng)景里面普遍存在、長(zhǎng)期出現(xiàn),甚至它比一個(gè)人還能更關(guān)注另一個(gè)人,它會(huì)對(duì)這個(gè)社會(huì)帶來什么改變?它有什么好的影響,又有什么讓我們擔(dān)心的問題,你們有沒有想過?畢竟你們?cè)谶@個(gè)領(lǐng)域深耕了這么久。

 石海林:其實(shí)在這個(gè)層面我們確實(shí)做過深入的思考,關(guān)于這個(gè)問題我們有一個(gè)比較適合的思考切入角度 —— 從技術(shù)發(fā)展的速度來看,面向情感價(jià)值、情感陪護(hù)這個(gè)方向的機(jī)器人也好,具身智能產(chǎn)品也好,技術(shù)迭代真的非??臁挠布蟻碚f,不管是續(xù)航能力、結(jié)構(gòu)復(fù)雜度,還是散熱效果、運(yùn)行噪音,甚至是外觀設(shè)計(jì),這些其實(shí)都還有很大的進(jìn)步空間,但整體的發(fā)展速度非常快。從我們行業(yè)內(nèi)的觀察、實(shí)踐以及整個(gè)產(chǎn)業(yè)的推進(jìn)節(jié)奏來看,這些技術(shù)的收斂速度會(huì)高過我們以前對(duì)它的預(yù)期。

相對(duì)硬件來說,軟件這兩年其實(shí)是走在前面的,甚至如果我們今天把 “情感陪伴” 收窄到僅僅是 “交互對(duì)話” 這個(gè)范圍的話,它其實(shí)已經(jīng)是一個(gè)成熟的技術(shù)了。所以這個(gè)東西怎么說呢?軟件相對(duì)來說是一個(gè)更成熟的板塊,當(dāng)然我們今天說的交互,可能不僅僅是語言上的交互 —— 它給人提供情緒價(jià)值,可能是因?yàn)轭佒底銐蛴懴?;比如我今天回家很累了,我的機(jī)器人幫我打掃完房間、收拾好碗筷,這個(gè)過程本身也能給我提供情緒價(jià)值;再比如它能跟我順暢互動(dòng)、回應(yīng)我的需求,同樣能提供情緒價(jià)值。

我們回頭看,面向情感陪伴的具身智能技術(shù)發(fā)展這么快,它勢(shì)必會(huì)推動(dòng)產(chǎn)品和功能的成熟化,也會(huì)推動(dòng)整個(gè)市場(chǎng)化的成熟,這個(gè)趨勢(shì)其實(shí)不太以人的意志為轉(zhuǎn)移,它是一個(gè)技術(shù)驅(qū)動(dòng)的必然結(jié)果。那我們今天來看,我本人屬于那種技術(shù)狂熱者,我會(huì)主動(dòng)去買悟空機(jī)器人這種陪伴型產(chǎn)品。其實(shí)不只是我,陪伴型機(jī)器人的目標(biāo)人群會(huì)從現(xiàn)在的技術(shù)狂熱者,逐步滲透到普通大眾接受者,這個(gè)過程同樣不受人的意志為轉(zhuǎn)移。

所以從今天的技術(shù)勢(shì)頭來看,我們更應(yīng)該思考的是怎么擁抱它、去接受它,怎么樣更好地使用它,而不是抗拒這個(gè)趨勢(shì)。

張鵬:所以今天它未必一上來就被所有人群接受,可能接下來在某類細(xì)分產(chǎn)品上,突然之間就會(huì)打開一個(gè)很大的市場(chǎng),進(jìn)而讓用戶和機(jī)器人之間建立更深層的關(guān)聯(lián)。所以我倒覺得這給咱們留下一個(gè)開放性的話題 —— 真到了那一步,當(dāng)你面對(duì)一個(gè)更廣泛的群體,比如孩子,今天的孩子如果抱上一個(gè)內(nèi)置 ChatGPT 的智能音箱,他還會(huì)跟智能音箱說謝謝嗎?我們之前看過一些相關(guān)的研究,今天的孩子如果發(fā)現(xiàn)智能音箱里有 ChatGPT 的能力,他會(huì)完全把它理解成一個(gè) “人”,會(huì)對(duì)它產(chǎn)生依賴,我覺得這些情況未來都會(huì)出現(xiàn)。

這件事可能引發(fā)我們接下來更復(fù)雜的思考 —— 看起來是一些交互層面的設(shè)定、一些規(guī)則的制定,但本質(zhì)上它可能會(huì)帶來一系列全新的問題:當(dāng)一些新的智能體進(jìn)入到人類社會(huì)之后,不管是具身的還是不具身的,都會(huì)對(duì)現(xiàn)有的社會(huì)關(guān)系、倫理觀念產(chǎn)生影響。所以這是一個(gè)開放性問題,而任何行業(yè)有開放性問題,都說明這個(gè)行業(yè)生機(jī)勃勃。

就像王叢總說的,世界是多元的,技術(shù)路線也應(yīng)該是多元的。今天各位嘉賓從形態(tài)選擇、技術(shù)瓶頸、數(shù)據(jù)生態(tài)、C端落地、情緒價(jià)值、倫理風(fēng)險(xiǎn)等多個(gè)角度,分享了各自的 “共識(shí)” 與 “非共識(shí)”,雖然沒有形成統(tǒng)一答案,但恰恰展現(xiàn)了這個(gè)行業(yè)的蓬勃生命力。

特別感謝各位嘉賓帶來的精彩分享,期待未來每年都能看到具身智能領(lǐng)域的新突破,也期待地瓜機(jī)器人這樣的生態(tài)賦能者能給行業(yè)帶來更多可能性。本場(chǎng)圓桌對(duì)話到此結(jié)束,謝謝大家!

來源:第一電動(dòng)網(wǎng)

作者:蓋世汽車

本文地址:http://www.cbbreul.com/news/shichang/281026

返回第一電動(dòng)網(wǎng)首頁 >

收藏
62
  • 分享到:
發(fā)表評(píng)論
新聞推薦
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!
-->