吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google的AI教會機(jī)器人學(xué)會了新的技能

獨(dú)愛72H ? 來源:教育新聞網(wǎng) ? 作者:教育新聞網(wǎng) ? 2020-05-07 22:37 ? 次閱讀

(文章來源:教育新聞網(wǎng))
谷歌和加州大學(xué)伯克利分校的研究人員在本周在預(yù)印本服務(wù)器Arxiv.org上發(fā)表的兩篇論文中描述了新的AI機(jī)器學(xué)習(xí)技術(shù),這些技術(shù)使機(jī)器人能夠適應(yīng)從未見過的任務(wù)并抓住被遮擋的物體。第一項研究詳細(xì)介紹了X射線,該算法在部署到機(jī)器人上時可以搜索對象的堆以掌握目標(biāo)對象,而第二項研究則提出了一種策略適應(yīng)技術(shù),可以“教”機(jī)器人技能,而無需從頭開始進(jìn)行模型訓(xùn)練。

抓機(jī)器人是一個非常困難的挑戰(zhàn)。例如,機(jī)器人努力執(zhí)行所謂的“機(jī)械搜索”,即當(dāng)他們不得不從一堆其他對象中識別并拾取一個對象時。大多數(shù)機(jī)器人不是特別適應(yīng)性強(qiáng),并且缺乏足夠功能強(qiáng)大的AI模型來指導(dǎo)機(jī)械手進(jìn)行機(jī)械搜索。X射線和策略調(diào)整步驟可以構(gòu)成產(chǎn)品包裝系統(tǒng)的基礎(chǔ),該產(chǎn)品包裝系統(tǒng)可以在無需人工監(jiān)督的情況下發(fā)現(xiàn),拾取和放下各種物體。

有關(guān)X射線的研究的合著者指出,由于缺乏合適的模型,機(jī)械搜索(在大量對象中找到對象)仍然具有挑戰(zhàn)性。X射線結(jié)合了遮擋推斷和假設(shè)預(yù)測來解決該問題,它可用來估計與對象最相似的邊界框(對象周圍矩形邊框的坐標(biāo))的占用率分布,同時考慮各種平移和旋轉(zhuǎn)。

X-Ray假定堆中至少有一個完全或部分被未知對象遮擋的目標(biāo)對象,并且每個時間步最多可以抓取一個對象。以RGB圖像和目標(biāo)對象為輸入,它可以預(yù)測場景的占用率分布和分割蒙版,并計算幾種潛在的抓握動作,以最高的成功概率執(zhí)行該動作。為了訓(xùn)練和驗證X射線,研究人員生成了10,000個增強(qiáng)深度圖像的語料庫,這些圖像標(biāo)記有矩形框目標(biāo)對象的對象占用分布。他們從Thingiverse上的1296個3D CAD模型的開放源數(shù)據(jù)集中進(jìn)行采樣,選擇了10個大小相同,體積較小但厚度較小的盒子目標(biāo),因此它們更有可能被遮擋。這使他們總共獲得了100,000張圖像。

在這10,000張圖片中,約有8,000張被保留用于培訓(xùn),其余的則留作測試。使用一千個包含模擬對象(蓋子,多米諾骨牌和長笛)的其他圖像來評估X射線對看不見的形狀,對象,長寬比和比例尺的概括。在涉及帶有吸盤和平行顎式抓爪的真實ABB YuMi機(jī)器人的物理實驗中,研究人員要求X射線將物體裝滿垃圾箱,然后將垃圾箱傾倒在目標(biāo)物體的頂部。在最初包含25個對象的堆中,系統(tǒng)在20次試驗中以5個動作的中位數(shù)提取了目標(biāo)對象,成功率為100%。

合著者將精力放在未來的工作上,以提高X射線的訓(xùn)練效率,并分析數(shù)據(jù)集大小以及用于生成訓(xùn)練分布的平移和旋轉(zhuǎn)次數(shù)的影響。他們還計劃根據(jù)目標(biāo)對象可見性的獎勵來探索強(qiáng)化學(xué)習(xí)策略。

在這兩篇論文的最新文章中,合著者試圖開發(fā)一種能夠不斷適應(yīng)新的現(xiàn)實環(huán)境,物體和條件的系統(tǒng)。與大多數(shù)機(jī)器人相反,后者僅需訓(xùn)練一次即可部署,而適應(yīng)能力卻很少。研究人員對機(jī)器學(xué)習(xí)模型進(jìn)行了預(yù)訓(xùn)練,以在608,000次嘗試抓取的語料庫中抓取一系列對象,然后他們執(zhí)行的任務(wù)是使用向其起始位置右移10厘米的抓手抓取對象。系統(tǒng)練習(xí)了一段時間(經(jīng)過800次嘗試)并將這些嘗試記錄到新數(shù)據(jù)集(目標(biāo)數(shù)據(jù)集)中之后,新嘗試在50%的時間內(nèi)與原始數(shù)據(jù)集進(jìn)行了混合,調(diào)整模型。

在五個不同的場景中重復(fù)了這些步驟-預(yù)訓(xùn)練,嘗試新任務(wù)和微調(diào)。一方面,刺眼的光線阻礙了機(jī)器人的攝像頭。在另一種情況下,棋盤圖案的背景使模型難以識別對象。最后,實驗人員讓機(jī)器人抓住訓(xùn)練中看不到的透明瓶子(眾所周知,透明物體很難抓住機(jī)器人,因為它們有時會混淆深度傳感器),并撿拾坐在高反射金屬板上的物體。

研究人員報告說,在實驗中,該模型成功地在苛刻的燈光下63%的時間,透明瓶子的74%的時間,棋盤墊板的時間的86%的時間,抓手?jǐn)U展的88%的時間成功地捕獲了物體,和91%的時間使用偏置夾持器。而且,他們說,機(jī)器人適應(yīng)新情況只需要花費(fèi)1-4個小時的練習(xí)時間(相比之下,學(xué)習(xí)如何掌握的時間大約為6,000個小時),并且性能不會隨著所適應(yīng)的模型而降低。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6195

    瀏覽量

    106016
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31520

    瀏覽量

    270335
收藏 人收藏

    評論

    相關(guān)推薦

    構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動生成管線

    通用人形機(jī)器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動機(jī)器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機(jī)構(gòu),它們的價值日益凸顯。
    的頭像 發(fā)表于 01-16 10:58 ?360次閱讀
    構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)</b>習(xí)的合成運(yùn)動生成管線

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    工智能 認(rèn)知發(fā)展機(jī)器人學(xué) 進(jìn)化機(jī)器人學(xué) 物理體現(xiàn)與互動 五、具身智能的現(xiàn)代技術(shù)方向 另外,隨著GPT等大語言模型的發(fā)展,這些技術(shù)也在具身智能機(jī)器人領(lǐng)域掀起了一股浪潮,那就是基于大模型的具身智能技術(shù)
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】+初品的體驗

    動態(tài)互動的。 該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計算機(jī)視覺、自然語言處理及強(qiáng)化學(xué)習(xí)等領(lǐng)域
    發(fā)表于 12-20 19:17

    NVIDIA通過加速AWS上的機(jī)器人仿真推進(jìn)物理AI的發(fā)展

    。 Field AI 正在構(gòu)建使機(jī)器人能夠自主管理各種工業(yè)流程的機(jī)器人大腦;Vention 創(chuàng)建了簡化機(jī)器人任務(wù)開發(fā)工作的預(yù)訓(xùn)練技能;Cob
    的頭像 發(fā)表于 12-09 11:50 ?377次閱讀

    名單公布!【書籍評測活動NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個浪潮!

    進(jìn)行動態(tài)互動實現(xiàn)的。 這種理論強(qiáng)調(diào),智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。 具身智能的實現(xiàn)涵蓋了 機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計算機(jī)視覺、自然語言處理
    發(fā)表于 11-11 10:20

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開發(fā)者可以使用這些工具和工作流,大大加快 AI
    的頭像 發(fā)表于 11-09 11:52 ?343次閱讀

    麻省理工學(xué)院推出新型機(jī)器人訓(xùn)練模型

    近日,據(jù)TechCrunch報道,麻省理工學(xué)院的研究團(tuán)隊展示了一種創(chuàng)新的機(jī)器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為機(jī)器人學(xué)習(xí)新技能開辟了全新的道路。
    的頭像 發(fā)表于 11-04 14:56 ?553次閱讀

    機(jī)器人的三大矩陣是什么及關(guān)系式

    機(jī)器人學(xué)中,三大矩陣主要指的是與機(jī)器人位移、速度和力相關(guān)的矩陣,它們分別揭示了機(jī)器人在不同空間(如關(guān)節(jié)空間和作業(yè)空間)之間的映射關(guān)系。這三大矩陣及其關(guān)系式可以概括如下: 1. T矩陣(變換矩陣
    的頭像 發(fā)表于 09-04 09:37 ?1759次閱讀

    “卷不動了”?OTA來救場!智能機(jī)器人“永葆青春”的秘訣

    的掃地機(jī)器人突然學(xué)會了拖地,是不是很酷?OTA就是讓這種“逆天改命”成為可能的魔法! 1、智能機(jī)器人的發(fā)展趨勢與OTA機(jī)遇 智能機(jī)器人3.0時代,用戶需求日益多樣化,模塊化、定制化成為
    的頭像 發(fā)表于 08-06 16:01 ?488次閱讀
    “卷不動了”?OTA來救場!智能<b class='flag-5'>機(jī)器人</b>“永葆青春”的秘訣

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊開發(fā),與同行相比具有許多優(yōu)勢:語言
    發(fā)表于 07-05 08:52

    NVIDIA Isaac 機(jī)器人平臺利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展

    觀眾展示了用于人形機(jī)器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機(jī)器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機(jī)器人平臺的各種工具來創(chuàng)建用于人形
    的頭像 發(fā)表于 06-04 18:00 ?7781次閱讀
    NVIDIA Isaac <b class='flag-5'>機(jī)器人</b>平臺利用最新的生成式 <b class='flag-5'>AI</b> 和先進(jìn)的仿真技術(shù),加速 <b class='flag-5'>AI</b> <b class='flag-5'>機(jī)器人</b>技術(shù)的發(fā)展

    使用NVIDIA Isaac Manipulator生成抓取姿勢和機(jī)器人運(yùn)動

    NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機(jī)器人任務(wù)的基礎(chǔ)技能模型學(xué)習(xí)展開合作。
    的頭像 發(fā)表于 05-17 10:33 ?1464次閱讀
    使用NVIDIA Isaac Manipulator生成抓取姿勢和<b class='flag-5'>機(jī)器人</b>運(yùn)動

    NVIDIA Isaac機(jī)器人平臺升級,加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺正不斷擴(kuò)展其基礎(chǔ)模型、
    的頭像 發(fā)表于 03-27 10:36 ?745次閱讀

    機(jī)器人學(xué)習(xí)中主流智能抓取方案

    RGB顏色空間由紅綠藍(lán)三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機(jī)器人通過顏色坐標(biāo)值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?342次閱讀
    <b class='flag-5'>機(jī)器人學(xué)</b>習(xí)中主流智能抓取方案

    谷歌AI聊天機(jī)器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機(jī)器人Bard正式更名為Gemini,并推出了一款功能更加強(qiáng)大的付費(fèi)版本——Gemini Advanced。這一戰(zhàn)略調(diào)整旨在與微軟、OpenAI等科技巨頭在
    的頭像 發(fā)表于 02-18 11:28 ?1199次閱讀
    八大胜娱乐场| 国际娱百家乐的玩法技巧和规则| 百家乐官网赌王有哪些| 广州百家乐赌场娱乐网规则| 百家乐官网娱乐城赌场| 百家乐德州扑克桌布| 百家乐官网技巧辅助软件| 久盛国际| 百家乐板路| 百家乐官网闲庄和| 棋牌评测| 什么百家乐平注法| 百家乐官网网上投注作弊| 澳门百家乐赌技术| 永利博百家乐官网游戏| 全讯网赢足一世| 百家乐视频软件| 百家乐官网连赢的策略| 大发888真钱娱乐场下载| 百家乐官网微笑打法| 澳客网比分直播| 试玩百家乐1000| 百家乐官网娱乐分析软件v| 威尼斯人娱乐游戏| 百家乐官网英皇赌场娱乐网规则| 365新网址| 百家乐官网赚水方法| 速博娱乐| rmb百家乐的玩法技巧和规则 | 明珠网上娱乐| 亚洲百家乐博彩的玩法技巧和规则 | 澳门百家乐官网赢钱秘| 香港六合彩图库| 新梦想百家乐的玩法技巧和规则| 百家乐官网庄牌| 玩百家乐官网五湖四海娱乐城| 综合百家乐博彩论坛| 百家乐出千大全| 龙南县| 百家乐娱乐场开户注册| 自贡百家乐官网赌|