脖子上掛著VR眼鏡,左右手各握著一個(gè)操作手柄,齊丹開始操作面前和她差不多高的人形機(jī)器人。她抬起左手,機(jī)器人也跟著抬起左手;她俯身看桌面,機(jī)器人也跟著低頭。兩“人”十分默契。
齊丹今年23歲,她的職業(yè)很特殊——人形機(jī)器人數(shù)據(jù)采集員。今年從武漢職業(yè)技術(shù)大學(xué)大數(shù)據(jù)專業(yè)畢業(yè)后,齊丹加入數(shù)聚變(武漢)科技有限公司,在湖北人形機(jī)器人創(chuàng)新中心從事數(shù)據(jù)采集工作,在這里,像齊丹一樣的采集員已有66人,他們平均年齡只有21歲。

齊丹正在操控機(jī)器人。
01
她給機(jī)器人當(dāng)動(dòng)作老師
10日,記者見到齊丹時(shí),她正在教機(jī)器人收拾電視柜。先把光碟等散落在柜子上,打造一個(gè)雜亂的場(chǎng)景。VR眼鏡能感知采集員的方位、動(dòng)作幅度等。齊丹一動(dòng),機(jī)器人也跟著移動(dòng)。
她說:“我們采集員就像老師一樣,要帶著機(jī)器人完成每一個(gè)動(dòng)作。過程中所產(chǎn)生的視頻、運(yùn)動(dòng)軌跡等各種數(shù)據(jù)就是我們工作的意義。這些數(shù)據(jù)為機(jī)器人以后能自主完成動(dòng)作提供了重要的學(xué)習(xí)資料?!?/p>

采集員正在操控機(jī)器人。
光碟薄薄一片貼在桌子上,人拿起來都費(fèi)勁,機(jī)器人的手是兩片夾子狀,如何夾起光碟?剛做采集員時(shí),齊丹也摸不著頭緒?!半m然機(jī)器人能隨著我的動(dòng)作同步運(yùn)動(dòng),但偶爾速度快了,力度大了,它還是會(huì)跟不上。剛開始教機(jī)器人倒水,我用力過猛,夾壞了好幾個(gè)杯子。有時(shí)候抓不穩(wěn),水也灑了。每個(gè)采集員都只能通過無數(shù)次嘗試,找感覺。”
慢慢地,齊丹也找到了一些技巧,她把自己當(dāng)成機(jī)器人?!拔蚁扔糜沂猪斪」獾阉频阶雷舆吘?,讓光碟一半懸空。再用左手夾住它的邊緣,順利拿起。看似簡(jiǎn)單的動(dòng)作,需要采集員一步步拆解,找到機(jī)器人最舒服、最便捷的角度和方法。你能感覺到它是另一個(gè)自己。”

采集員正在操控機(jī)器人。
完成一次桌面清潔任務(wù),大約5分鐘。機(jī)器人的手部、頭部都有攝像頭和傳感器。5分鐘的任務(wù),產(chǎn)生了4000多兆的數(shù)據(jù)。齊丹當(dāng)天的任務(wù)量是完成125次清潔任務(wù)。采集員們還會(huì)在不同場(chǎng)景里輪換教學(xué)。
02
還要教機(jī)器人理解動(dòng)作的意義
其實(shí),我們?nèi)粘?匆姷脑S多機(jī)器人都是根據(jù)程序設(shè)定完成的固定動(dòng)作。數(shù)聚變公司負(fù)責(zé)人曹吉胤介紹,要讓機(jī)器人實(shí)現(xiàn)具身智能,數(shù)據(jù)是技術(shù)底座?!按笳Z言模型需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練,機(jī)器人也一樣。我們要讓機(jī)器人在真實(shí)的物理空間去完成各種各樣的任務(wù),從而產(chǎn)生大量可以通用、泛化的數(shù)據(jù)。機(jī)器人就像是一個(gè)嬰兒,它們無法自己理解接收到的信息。我們要手把手教他們認(rèn)識(shí)顏色、物體、空間,教它們?nèi)绾胃褚粋€(gè)真人。”
齊丹采集的數(shù)據(jù)完成后,便傳到后方仲濤手中。仲濤從事數(shù)據(jù)標(biāo)注、審核工作已經(jīng)2年了。齊丹是教機(jī)器人做動(dòng)作,仲濤則是告訴機(jī)器人為什么要這樣做。

工作人員商量工作方案。
一段5分鐘的視頻素材,仲濤需要拆解每一個(gè)步驟。畫面暫停在第10秒,機(jī)器人正在拿起桌上的物品,仲濤需要給這段視頻配上文字說明:機(jī)器人左手正在拿起桌上綠色的本子。“機(jī)器人是沒辦法自己理解視頻內(nèi)容的,我們要一點(diǎn)點(diǎn)告訴它視頻中哪個(gè)是本子,哪個(gè)是光碟。它們要通過我的每一個(gè)標(biāo)注來進(jìn)行語義分析,從而理解視頻里動(dòng)作的意義。”
5分鐘的視頻,一步步進(jìn)行標(biāo)注,并清洗掉錯(cuò)誤的數(shù)據(jù),大約需要40分鐘才能完成。仲濤一天要標(biāo)注30多條數(shù)據(jù)。
一個(gè)看似簡(jiǎn)單的動(dòng)作往往需要投入兩到三個(gè)月的訓(xùn)練周期,每日重復(fù)數(shù)百次,累計(jì)產(chǎn)生數(shù)千乃至上萬條訓(xùn)練數(shù)據(jù)。
03
越來越多年輕人加入
隨著人形機(jī)器人產(chǎn)業(yè)進(jìn)一步發(fā)展,產(chǎn)業(yè)分工越來越精細(xì)。采集員這個(gè)全新的崗位,正吸引越來越多年輕人。21歲的張嘉從一家溫州的自動(dòng)駕駛公司來到武漢投入機(jī)器人工作;22歲的劉書威學(xué)習(xí)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),目前正在數(shù)聚變公司實(shí)習(xí);21歲的林萬利已成為公司運(yùn)營(yíng)管理負(fù)責(zé)人之一?!澳芙虝?huì)機(jī)器人學(xué)習(xí),非常有成就感?!睆埣握f。
湖北人形機(jī)器人創(chuàng)新中心還原了倉庫、超市、住宅、餐廳等23個(gè)工作和生活場(chǎng)景,是目前國(guó)內(nèi)規(guī)模最大、場(chǎng)景最豐富、機(jī)器人款式最多的“機(jī)器人學(xué)校”。運(yùn)營(yíng)負(fù)責(zé)人黃全周介紹,中心擁有100多臺(tái)各型機(jī)器人,每天能產(chǎn)出2.4萬條有效數(shù)據(jù),一年采集的有效數(shù)據(jù)將超千萬條。
產(chǎn)業(yè)加速跑,離不開人才的持續(xù)供給。中心與武漢工程大學(xué)、武漢城市職業(yè)學(xué)院等多所高校合作,開設(shè)微專業(yè),接收大量實(shí)習(xí)生,讓他們將理論知識(shí)轉(zhuǎn)化為實(shí)踐技能,成長(zhǎng)為行業(yè)急需的“全鏈路人才”。
在這個(gè)由“00后”年輕人主導(dǎo)的“學(xué)?!崩?,機(jī)器人正一步步地從笨拙的模仿者,成長(zhǎng)為能夠靈活應(yīng)對(duì)真實(shí)世界的具身智能助手。也許,過不了多久,它們就能走進(jìn)我們的生活!
文字/視頻| 記者覃柳瑋
攝影| 記者史偉
實(shí)習(xí)生| 高云鵬
制作| 王戎飛
編輯:張紅艷