吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓Transformer在多種模態下處理不同領域的廣泛應用?

深度學習自然語言處理 ? 來源:AI公園 ? 作者:Synced ? 2021-03-08 10:30 ? 次閱讀

一個模型完成了CV,NLP方向的7個任務,每個任務上表現都非常好。

Transformer架構在自然語言處理和其他領域的機器學習(ML)任務中表現出了巨大的成功,但大多僅限于單個領域或特定的多模態領域的任務。例如,ViT專門用于視覺相關的任務,BERT專注于語言任務,而VILBERT-MT只用于相關的視覺和語言任務。

一個自然產生的問題是:我們能否建立一個單一的Transformer,能夠在多種模態下處理不同領域的廣泛應用?最近,Facebook的一個人工智能研究團隊進行了一個新的統一Transformer(UniT) encoder-decoder模型的挑戰,該模型在不同的模態下聯合訓練多個任務,并通過一組統一的模型參數在這些不同的任務上都實現了強大的性能。

Transformer首先應用于sequence-to-sequence模型的語言領域。它們已經擴展到視覺領域,甚至被應用于視覺和語言的聯合推理任務。盡管可以針對各種下游任務中的應用對預先訓練好的Transformer進行微調,并獲得良好的結果,但這種模型微調方法會導致為每個下游任務創建不同的參數集。

Facebook的人工智能研究人員提出,一個Transformer可能就是我們真正需要的。他們的UniT是建立在傳統的Transformer編碼器-解碼器架構上,包括每個輸入模態類型的獨立編碼器,后面跟一個具有簡單的每個任務特定的頭的解碼器。輸入有兩種形式:圖像和文本。首先,卷積神經網絡骨干網提取視覺特征,然后BERT將語言輸入編碼成隱藏狀態序列。然后,Transformer解碼器應用于編碼的單個模態或兩個編碼模態的連接序列(取決于任務是單模態還是多模態)。最后,Transformer解碼器的表示將被傳遞到特定任務的頭,該頭將輸出最終的預測。

UniT模型概要

評估UniT的性能,研究人員進行了實驗,需要共同學習來自不同領域的許多流行的任務:COCO目標檢測和 Visual Genome數據集,語言理解任務的GLUE基準(QNLI, QQP、MNLI-mismatched SST-2),以及視覺推理任務VQAv2 SNLI-VE數據集。

8d044a88-7f2a-11eb-8b86-12bb97331649.png

多任務訓練的UniT性能優于單獨訓練的目標檢測和VQA

8d3f74fa-7f2a-11eb-8b86-12bb97331649.png

基于UniT模型的目標檢測與VQA的分析

8d86f6fe-7f2a-11eb-8b86-12bb97331649.png

UniT模型在8個數據集的7個任務上的性能

具有共享解碼器的UniT模型的預測

結果表明,所提出的UniT 模型同時處理8個數據集上的7個任務,在統一的模型參數集下,每個任務都有較強的性能。強大的性能表明UniT有潛力成為一種領域未知的transformer 架構,向更通用的智能的目標邁進了一步。

原文標題:【多模態】來自Facebook AI的多任務多模態的統一Transformer:向更通用的智能邁出了一步

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31536

    瀏覽量

    270344
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240302
  • 機器學習
    +關注

    關注

    66

    文章

    8441

    瀏覽量

    133087

原文標題:【多模態】來自Facebook AI的多任務多模態的統一Transformer:向更通用的智能邁出了一步

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Norflash閃存芯片HT25Q20D廣泛應用在汽車電子領域

    全球NOR Flash市場由四家主要制造商主導,除巨頭之外,還有華芯邦等廠商市場上也占有一席之地,主要為藍牙、音頻、WIFI等SoC主控芯片生產商供貨,其產品廣泛應用于各種消費電子品牌。例如HT25Q20D廣泛應用在汽車電子
    的頭像 發表于 01-13 15:20 ?461次閱讀
    Norflash閃存芯片HT25Q20D<b class='flag-5'>廣泛應用</b>在汽車電子<b class='flag-5'>領域</b>

    智慧交通技術的廣泛應用領域

    智慧交通 是一種結合了信息技術、通信技術和交通管理的創新模式,旨在提高城市交通系統的效率、安全性和可持續性。智慧交通技術各個領域廣泛的運用范圍,涵蓋了城市交通管理、公共交通系統、道路安全、車輛
    的頭像 發表于 12-11 11:51 ?627次閱讀

    氣體傳感器模塊應急救援領域廣泛應用與未來展望

    能力和強大的氣體監測功能,成為應急救援工作中不可或缺的重要工具。 氣體傳感器應急救援領域的應用范圍十分廣泛,從預防階段到響應階段,再到恢復階段,都發揮著舉足輕重的作用。預防階段,通
    的頭像 發表于 11-18 10:03 ?387次閱讀
    氣體傳感器模塊<b class='flag-5'>在</b>應急救援<b class='flag-5'>領域</b>的<b class='flag-5'>廣泛應用</b>與未來展望

    利用OpenVINO部署Qwen2多模態模型

    模態大模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,多模態大模型可以可以理解
    的頭像 發表于 10-18 09:39 ?553次閱讀

    FPGA圖像處理領域的優勢有哪些?

    高的應用領域,FPGA是圖像處理的理想選擇。 綜上所述,FPGA圖像處理領域具有并行處理能力強
    發表于 10-09 14:36

    IP宿主信息不同領域廣泛應用

    廣泛應用。 什么是IP宿主信息? IP宿主信息是指與特定IP地址相關聯的詳細數據集合。通過網絡技術手段,對特定IP地址進行深度解析后獲得的一系列相關信息。提供郵政編碼、經緯度等信息的基礎上為用戶提供更加詳細的信息,如行業類型、商圈地址、
    的頭像 發表于 09-06 09:49 ?448次閱讀

    FPGA自動駕駛領域有哪些應用?

    控制。視覺算法方面,FPGA利用自身并行處理和高速存儲器的特點,極大地加快了算法的執行速度,提高了運算效率。 五、未來發展趨勢隨著自動駕駛技術的不斷發展,FPGA自動駕駛領域的應用
    發表于 07-29 17:09

    Transformer能代替圖神經網絡嗎

    Transformer作為一種處理序列數據方面表現出色的深度學習模型,自其提出以來,已經自然語言處理(NLP)、時間序列分析等
    的頭像 發表于 07-12 14:07 ?536次閱讀

    Transformer語言模型簡介與實現過程

    自然語言處理(NLP)領域Transformer模型以其卓越的性能和廣泛的應用前景,成為了近年來最引人注目的技術之一。
    的頭像 發表于 07-10 11:48 ?2079次閱讀

    Transformer架構自然語言處理中的應用

    隨著人工智能技術的飛速發展,自然語言處理(NLP)領域取得了顯著的進步。其中,Transformer架構的提出,為NLP領域帶來了革命性的變革。本文將深入探討
    的頭像 發表于 07-09 11:42 ?952次閱讀

    Transformer模型語音識別和語音生成中的應用優勢

    自然語言處理、語音識別、語音生成等多個領域展現出強大的潛力和廣泛的應用前景。本文將從Transformer模型的基本原理出發,深入探討其
    的頭像 發表于 07-03 18:24 ?1310次閱讀

    使用PyTorch搭建Transformer模型

    Transformer模型自其問世以來,自然語言處理(NLP)領域取得了巨大的成功,并成為了許多先進模型(如BERT、GPT等)的基礎。本文將深入解讀如何使用PyTorch框架搭建
    的頭像 發表于 07-02 11:41 ?1844次閱讀

    基于Transformer模型的壓縮方法

    基于Transformer架構的大型模型人工智能領域中發揮著日益重要的作用,特別是自然語言處理(NLP)和計算機視覺(CV)
    的頭像 發表于 02-22 16:27 ?715次閱讀
    基于<b class='flag-5'>Transformer</b>模型的壓縮方法

    三坐標測量儀的高精度測量功能與廣泛應用領域詳解

    三坐標測量儀作為一種高精度的測量設備,被廣泛應用于各種復雜零件的檢測和測量。它綜合了機械、光學、電子、計算機等多種技術,能夠準確測量物體的尺寸、形狀、位置和曲面特征等多個方面。具有廣泛的應用
    的頭像 發表于 02-22 09:12 ?2292次閱讀
    三坐標測量儀的高精度測量功能與<b class='flag-5'>廣泛應用領域</b>詳解

    一文詳解Transformer神經網絡模型

    Transformer模型強化學習領域的應用主要是應用于策略學習和值函數近似。強化學習是指機器與環境互動的過程中,通過試錯來學習最優的
    發表于 02-20 09:55 ?1.6w次閱讀
    一文詳解<b class='flag-5'>Transformer</b>神經網絡模型
    摩纳哥百家乐娱乐城| 太阳城亚洲| 百家乐官网园小区户型图| 百家乐模拟投注器| 澳门顶级赌场官网| 百家乐官网赢输| 大发888掉线| 百家乐官网扫描技术| 新锦江百家乐赌场娱乐网规则| 河曲县| 百家乐高人玩法| 龙博娱乐城| 新世纪百家乐现金网| 大发888娱乐城充值| 百家乐官网免费改单| 金百家乐博彩公司| 豪博娱乐城| 百家乐赌博平台| 百家乐官网稳赢赌法| 宝马会百家乐的玩法技巧和规则| 百家乐官网小型抽水泵| 威尼斯人娱乐城信誉怎样| 新时代百家乐官网娱乐城| 尚品棋牌注册| 现金百家乐伟易博| 文水县| 威尼斯人娱乐城代理开户| 路单百家乐官网的玩法技巧和规则| 娱乐城简介| 金城百家乐平台| 哪个百家乐官网投注好| 大发888m磨卡游戏| 2404这个房号 风水| 武平县| 明珠百家乐的玩法技巧和规则| 百家乐官网作弊知识| 扬中棋牌游戏中心| 366百家乐娱乐城| 百家乐官网高档筹码| 大发888使用条款| 菲律宾百家乐的说法|