創(chuàng)澤機器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 機器人開發(fā) > 大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

來源:CAAI認(rèn)知系統(tǒng)與信息處理專委會     編輯:創(chuàng)澤   時間:2023/9/6   主題:其他 [加盟]

從斯坦福大學(xué)的 VIMA 機器人智能體,到谷歌 DeepMind 推出首個控制機器人的視覺 - 語言 - 動作(VLA)的模型 RT-2,大模型加持的機器人研究備受關(guān)注。

當(dāng)前,自監(jiān)督和語言監(jiān)督的圖像模型已經(jīng)包含豐富的世界知識,這對于泛化來說非常重要,但圖像特征是二維的。我們知道,機器人任務(wù)通常需要對現(xiàn)實世界中三維物體的幾何形狀有所了解。

基于此,來自 MIT CSAIL 和 IAIFI 的研究者利用蒸餾特征場(Distilled Feature Field,DFF),將準(zhǔn)確的 3D 幾何圖形與來自 2D 基礎(chǔ)模型的豐富語義結(jié)合起來,讓機器人能夠利用 2D 基礎(chǔ)模型中豐富的視覺和語言先驗,完成語言指導(dǎo)的操作。

論文地址:https://arxiv.org/abs/2308.07931

具體來說,該研究提出了一種用于 6-DOF 抓取和放置的小樣本學(xué)習(xí)方法,并利用強大的空間和語義先驗泛化到未見過物體上。使用從視覺 - 語言模型 CLIP 中提取的特征,該研究提出了一種通過開放性的自然語言指令對新物體進(jìn)行操作,并展示了這種方法泛化到未見過的表達(dá)和新型物體的能力。

研究團(tuán)隊用一個講解視頻詳細(xì)介紹了 F3RM 方法的技術(shù)原理:






控制器在機器人運動控制系統(tǒng)中發(fā)揮核心作用

運動控制器以傳感器為信號敏感元件,以電機或動力裝置和執(zhí)行單元為控制對象的一種控制裝置,為電機或其它動力和執(zhí)行裝置提供正確的控制信號

機器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)

典型的機器人電子電氣結(jié)構(gòu)主要由以下部分組成, 電源管理,環(huán)境感知,中央控制單元,電機控制,人機界面, 可選組件和其他應(yīng)用

氣壓/液壓驅(qū)動型機器人靈巧手特點

通過動力元件推動工作介質(zhì)(液體或氣體)在缸體內(nèi)產(chǎn) 生壓力差而驅(qū)動執(zhí)行元件,與其他驅(qū)動方式相比,液壓和氣壓驅(qū)動具有輸出功率密度大,易于實現(xiàn)遠(yuǎn)距離控制以及輸出力大等優(yōu)點

電機驅(qū)動型機器人靈巧手特點

微型驅(qū)動器和減速器的發(fā)展為手指驅(qū)動系統(tǒng)的微型化和集成化創(chuàng)造了條件,其直線驅(qū)動器將旋轉(zhuǎn)電機,旋轉(zhuǎn)直線轉(zhuǎn)換結(jié)構(gòu)和減速機都集成在靈巧手內(nèi)部

驅(qū)動器混合置型機器人靈巧手特點

混合置式靈巧手將一部分驅(qū)動器放在手臂,既保證了驅(qū)動力,也降低了靈巧手本體的體積, 使得靈巧手更加擬人化

驅(qū)動器內(nèi)置型機器人靈巧手特點

驅(qū)動器內(nèi)置式靈巧手各關(guān)節(jié)具有較好的剛性,更利于傳感器的直接測量,且模塊化設(shè)計利于更換維護(hù);整手尺寸較大,關(guān)節(jié)靈活度下降

驅(qū)動器外置型機器人靈巧手特點

靈巧手的外觀設(shè)計更加擬人化,手指本體更加纖細(xì);可以采用更大的驅(qū)動電機,從而增大手指的輸出力;驅(qū)動器與手本體之間距離遠(yuǎn)增加了控制器設(shè)計的難度

機器人多指靈巧手經(jīng)歷了三個階段

第一階段是從 20 世紀(jì) 70 年代—20 世紀(jì) 90 年代,典型代表是日本的 Okada、美國的 Stanford/JPL 和 Utah/MIT;第二階段是從 20 世紀(jì) 90 年代到 2010 年

機器人靈巧手是指數(shù)≥3,自由度≥9 的末端執(zhí)行器

靈巧手是機器人操作和動作執(zhí)行的末端工具,滿足兩個條件:指關(guān)節(jié)運動時能使物體產(chǎn)生任意運動,指關(guān)節(jié)固定時能完全限制物體的運動,定義靈巧手是指數(shù)≥3,自由度≥9 的末端執(zhí)行器

智能類人機器人特斯拉擎天柱 (Optimus) 執(zhí)行機構(gòu)分析

特斯拉公布了 6 種規(guī)格的執(zhí)行器,旋轉(zhuǎn)執(zhí)行器采用諧波減速器+電機的方案,線性執(zhí)行器采用絲杠+電機的方案,對于手掌關(guān)節(jié),其采用了空心杯電機+蝸輪蝸桿的結(jié)構(gòu)

人形機器人前主要聚焦于運動控制能力的提升

人形機器人有更強的柔性化水平,更好的環(huán)境感知能力和判斷能力,首要需要解決的問題是如何實現(xiàn)像人一樣去運動,能夠兼顧可靠性

特斯拉機器人軀干共有28個關(guān)節(jié)

28個執(zhí)行器分別為肩關(guān)節(jié)(單側(cè)三自由度旋轉(zhuǎn)關(guān)節(jié))6個,肘關(guān)節(jié)(單側(cè)直線關(guān)節(jié))2個,腕部關(guān)節(jié)(單側(cè)2個直線+1個旋轉(zhuǎn))6個,腰部(二自由度旋轉(zhuǎn)關(guān)節(jié))2個
資料獲取
機器人開發(fā)
== 最新資訊 ==
大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人
我國機器人產(chǎn)業(yè)場景拓展,“機器人+”應(yīng)用
控制器在機器人運動控制系統(tǒng)中發(fā)揮核心作用
機器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)
服務(wù)機器人中國市場規(guī)模-2024年CAG
人形機器人提供算力支撐:FSD芯片與Do
仿真學(xué)習(xí):不斷訓(xùn)練算法,提升機器人能力
智能服務(wù)機器人手部抓取,算法要求極高
人形整機平衡與行走步態(tài)是基本
人形機器人行為規(guī)劃難度遠(yuǎn)高于自動駕駛
人形機器人是頭部科技公司的競爭
軟件決定人形機器人高度,算法需與硬件匹配
人形機器人空間測算:25年起步,30年開
人形機器人商業(yè)化:細(xì)分領(lǐng)域突破到通用型,
人形機器人難點:軟硬件均存在難點,降本與
== 機器人推薦 ==
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務(wù)機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務(wù)機器人底盤  核酸采樣機器人  機器人代工廠  智能配送機器人  噴霧消毒機器人  圖書館機器人  導(dǎo)引機器人  移動消毒機器人  導(dǎo)診機器人  迎賓接待機器人  前臺機器人  消殺機器人  導(dǎo)覽機器人 
版權(quán)所有 創(chuàng)澤智能機器人集團(tuán)股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728