吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

適用于任意數據模態的自監督學習數據增強技術

OpenCV學堂 ? 來源:機器之心 ? 2023-09-04 10:07 ? 次閱讀

本文提出了一種適用于任意數據模態的自監督學習數據增強技術。

自監督學習算法在自然語言處理、計算機視覺等領域取得了重大進展。這些自監督學習算法盡管在概念上是通用的,但是在具體操作上是基于特定的數據模態的。這意味著需要為不同的數據模態開發不同的自監督學習算法。為此,本文提出了一種通用的數據增強技術,可以應用于任意數據模態。相較于已有的通用的自監督學習,該方法能夠取得明顯的性能提升,同時能夠代替一系列為特定模態設計的復雜的數據增強方式并取得與之類似的性能。

簡介 當前 Siamese 表征學習 / 對比學習需要利用數據增強技術來構建同一個數據的不同樣本,并將其輸入兩個并行的網絡結構,從而產生足夠強的監督信號。然而這些數據增強技術往往非常依賴于模態特定的先驗知識,通常需要手動設計或者搜索適用于當前模態的最佳組合。除了耗時耗力外,找到的最優數據增強方式也極難遷移到別的領域。例如,常見的針對于自然 RGB 圖像的顏色抖動(color jittering)無法應用于除了自然圖像以外的其他數據模態。 一般性地,輸入數據可以被表征為由序列維度(sequential)和通道維度(channel)組成的二維向量。其中序列維度通常是模態相關的,例如圖像上的空間維度、語音的時間維度以及語言的句法維度。而通道維度是模態無關的。在自監督學習中,masked modeling [1] 或者以 masking 作為數據增強 [2] 已經成為一種有效的學習方式。然而這些操作都作用于序列維度。為了能夠廣泛應用于不同數據模態,本文提出一種作用于通道維度的數據增強手段:隨機量化(randomized quantization)。每個通道中的數據通過非均勻量化器進行動態量化,量化值是從隨機劃分的區間中隨機采樣的。通過這種方式,落在同一個區間內原始輸入的信息差被刪除,同時不同區間數據的相對大小被保留,從而達到 masking 的效果。

18f147e4-4a3f-11ee-97a6-92fbcf53809c.png

該方法在各種不同數據模態上超過了已有任意模態自監督學習方法,包括自然圖像、3D 點云、語音、文本、傳感器數據、醫療圖像等。在多種預訓練學習任務中,例如對比學習(例如 MoCo-v3)和自蒸餾自監督學習(例如 BYOL)都學到了比已有方法更優的特征。該方法還經過驗證,適用于不同的骨干網絡結構,例如 CNN 和 Transformer。 方法 量化(Quantization)指的是利用一組離散的數值表征連續數據,以便于數據的高效存儲、運算以及傳輸。然而,一般的量化操作的目標是在不損失精確度的前提下壓縮數據,因而該過程是確定性的,而且是設計為與原數據盡量接近的。這就限制了其作為增強手段的強度和輸出的數據豐富程度。 本文提出一種隨機量化操作(randomized quantization),將輸入的每個 channel 數據獨立劃分為多個互不重疊的隨機區間(1901cea2-4a3f-11ee-97a6-92fbcf53809c.png),并將落在各個區間內的原始輸入映射到從該區間內隨機采樣的一個常數190b8244-4a3f-11ee-97a6-92fbcf53809c.png。 ?

19153942-4a3f-11ee-97a6-92fbcf53809c.png

隨機量化作為自監督學習任務中 masking 通道維度數據的能力取決于以下三個方面的設計:1) 隨機劃分數值區間;2) 隨機采樣輸出值以及 3)劃分的數值區間個數。 具體而言,隨機的過程帶來了更加豐富的樣本,同一個數據每次執行隨機量化操作都可以生成不同的數據樣本。同時,隨機的過程也帶來對原始數據更大的增強力度,例如隨機劃分出大的數據區間,或者當映射點偏離區間中值點時,都可以導致落在該區間的原始輸入和輸出之間的更大差異。 除此之外,也可以非常容易地通過適當減少劃分區間的個數,提高增強力度。這樣,當應用于 Siamese 表征學習的時候,兩個網絡分支就可以見到有足夠信息差異的輸入數據,從而構建足夠強的學習信號,幫助到特征學習。 下圖可視化了不同數據模態在使用了該數據增強方式之后的效果:

192515d8-4a3f-11ee-97a6-92fbcf53809c.png

實驗結果模態 1:圖像 本文在 ImageNet-1K 數據集上評估了 randomized quantization 應用于 MoCo-v3 和 BYOL 的效果,評測指標為 linear evaluation。當作為唯一的數據增強方式單獨使用的時候,即將本文的 augmentation 應用于原始圖像的 center crop,以及和常見的 random resized crop(RRC)配合使用的時候,該方法都取得了比已有通用自監督學習方法更好的效果。

19cc314c-4a3f-11ee-97a6-92fbcf53809c.png

相比于已有的針對圖像數據開發的數據增強方式,例如 color jittering (CJ),本文的方法有著明顯的性能優勢。同時,該方法也可以取代 MoCo-v3/BYOL 中一系列復雜的數據增強方式(Full),包括顏色抖動(color jittering)、隨機灰度化(gray scale)、隨機高斯模糊(Gaussian blur)、隨機曝光(solarization),并達到與復雜數據增強方式類似的效果。

1a0d2bd4-4a3f-11ee-97a6-92fbcf53809c.png

模態 2:3D 點云 本文還在 ModelNet40 數據集的分類任務和 ShapeNet Part 數據集的分割任務上驗證了 randomized quantization 相對于已有自監督工作的優越性。尤其在下游訓練集數據量較少的情況下,本文的方法顯著超過已有點云自監督算法。

1a27a96e-4a3f-11ee-97a6-92fbcf53809c.png

模態 3:語音 在語音數據集上本文的方法也取得了比已有自監督學習方法更優的性能。本文在六個下游數據集上驗證了該方法的優越性,其中在最難的數據集 VoxCeleb1 上(包含最多且遠超其他數據集的類別個數),本文方法取得了顯著的性能提升(5.6 個點)。

1a3fdfac-4a3f-11ee-97a6-92fbcf53809c.png

模態 4:DABS DABS 是一個模態通用自監督學習的基準,涵蓋了多種模態數據,包括自然圖像、文本、語音、傳感器數據、醫學圖像、圖文等。在 DABS 涵蓋的多種不同模態數據上,我們的方法也優于已有的任意模態自監督學習方式。

1a68cf48-4a3f-11ee-97a6-92fbcf53809c.png

審核編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2553

    文章

    51407

    瀏覽量

    756631
  • 數據
    +關注

    關注

    8

    文章

    7145

    瀏覽量

    89584
  • 模態
    +關注

    關注

    0

    文章

    9

    瀏覽量

    6276
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46130

原文標題:ICCV 2023?|?通用數據增強技術,隨機量化適用于任意數據模態

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于transformer和監督學習的路面異常檢測方法分享

    鋪設異常檢測可以幫助減少數據存儲、傳輸、標記和處理的壓力。本論文描述了一種基于Transformer和監督學習的新方法,有助于定位異常區域。
    的頭像 發表于 12-06 14:57 ?1679次閱讀
    基于transformer和<b class='flag-5'>自</b><b class='flag-5'>監督學習</b>的路面異常檢測方法分享

    你想要的機器學習課程筆記在這:主要討論監督學習和無監督學習

    with experience E(一個程序從經驗E中學習解決任務T進行某一任務量度P,通過P測量在T的表現而提高經驗E(另一種定義:機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。) 不同類型的機器
    發表于 12-03 17:12 ?595次閱讀

    如何用Python進行無監督學習

    監督學習是一種用于數據中查找模式的機器學習技術。無監督算法給出的
    的頭像 發表于 01-21 17:23 ?4329次閱讀

    機器學習算法中有監督和無監督學習的區別

    監督學習的好處之一是,它不需要監督學習必須經歷的費力的數據標記過程。但是,要權衡的是,評估其性能的有效性也非常困難。相反,通過將監督學習算法的輸出與測試
    的頭像 發表于 07-07 10:18 ?5844次閱讀

    監督學習與Transformer相關論文

    將在明年5月4日舉行,目前,本次大會投稿已經結束,最后共有3013篇論文提交。ICLR 采用公開評審機制,任何人都可以提前看到這些論文。 為了分析最新研究動向,我們精選了涵蓋監督學習
    的頭像 發表于 11-02 15:50 ?2737次閱讀
    <b class='flag-5'>自</b><b class='flag-5'>監督學習</b>與Transformer相關論文

    最基礎的半監督學習

    標記數據訓練的監督學習技術得到更好的結果。這是半監督學習系列文章的第1部分,對這個機器學習的重要子領域進行了簡要的介紹。 區分半
    的頭像 發表于 11-02 16:08 ?2706次閱讀

    監督學習最基礎的3個概念

    有趣的方法,用來解決機器學習中缺少標簽數據的問題。SSL利用未標記的數據和標記的數據集來學習任務。SSL的目標是得到比單獨使用標記
    的頭像 發表于 11-02 16:14 ?3032次閱讀
    半<b class='flag-5'>監督學習</b>最基礎的3個概念

    為什么半監督學習是機器學習的未來?

    揭示了添加無監督數據可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果,只需要一小部分的有標記
    的頭像 發表于 11-27 10:42 ?3961次閱讀

    監督學習:比監督學習做的更好

    監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精...
    的頭像 發表于 12-08 23:32 ?1472次閱讀

    基于人工智能的監督學習詳解

    監督學習讓 AI 系統能夠從很少的數據學習知識,這樣才能識別和理解世界上更微妙、更不常見的表示形式。
    的頭像 發表于 03-30 17:09 ?6060次閱讀
    基于人工智能的<b class='flag-5'>自</b><b class='flag-5'>監督學習</b>詳解

    機器學習中的無監督學習應用在哪些領域

    監督學習|機器學習| 集成學習|進化計算| 非監督學習| 半監督學習|
    發表于 01-20 10:52 ?5002次閱讀
    機器<b class='flag-5'>學習</b>中的無<b class='flag-5'>監督學習</b>應用在哪些領域

    監督學習的一些思考

    監督學習的流行是勢在必然的。在各種主流有監督學習任務都做到很成熟之后,數據成了最重要的瓶頸。從無標注數據
    發表于 01-26 18:50 ?1次下載
    <b class='flag-5'>自</b><b class='flag-5'>監督學習</b>的一些思考

    監督學習解鎖醫學影像洞察力

    數據,以及機器可以從中學習的復雜數據集標簽。 今天,被稱為弱監督學習的深度學習 (DL) 的一個分支正在幫助醫生通過減少對完整、準確和準確
    的頭像 發表于 09-30 18:04 ?1512次閱讀
    弱<b class='flag-5'>監督學習</b>解鎖醫學影像洞察力

    監督學習代碼庫存在的問題與挑戰

    當使用監督學習(Supervised Learning)對大量高質量的標記數據(Labeled Data)進行訓練時,神經網絡模型會產生有競爭力的結果。例如,根據Paperswithcode網站統計
    的頭像 發表于 10-18 16:28 ?1358次閱讀

    通用數據增強技術適用于任意數據模態的隨機量化

    一般性地,輸入數據可以被表征為由序列維度(sequential)和通道維度(channel)組成的二維向量。其中序列維度通常是模態相關的,例如圖像上的空間維度、語音的時間維度以及語言的句法維度。而通道維度是模態無關的。
    的頭像 發表于 09-12 16:40 ?427次閱讀
    通用<b class='flag-5'>數據</b><b class='flag-5'>增強</b><b class='flag-5'>技術</b>!<b class='flag-5'>適用于</b><b class='flag-5'>任意</b><b class='flag-5'>數據</b><b class='flag-5'>模態</b>的隨機量化
    大桥下做生意风水好吗| 百家乐官网怎么才能包赢| 半岛棋牌游戏| 百家乐赌博外挂| 中国百家乐官网技巧软件| 盈禾娱乐城| 百家乐永利娱乐| 送58百家乐官网的玩法技巧和规则 | 皇朝娱乐城| 太阳城亚州| 百家乐2棋牌作弊软件| 百家乐官网游戏机破解方法| 网络棋牌游戏| 威尼斯人娱乐城百家乐赌博| 百家乐怎么下注能赢| 狮威百家乐官网娱乐场| 宜都市| 大发8888娱乐场| 乐天堂百家乐娱乐| 百家乐作弊工具| 百家乐官网专打和局| 德州扑克高牌| 百家乐怎样玩才会赢钱| 澳门百家乐路单怎么看| 百家乐官网扑| 承德市| 金宝博网站| 二八杠分析仪| 百家乐排名| 百家乐网站那个好| 巴比伦百家乐官网的玩法技巧和规则| 百家乐官网注册开户送现金| 孟连| 金冠娱乐城怎么样| 百家乐投注杀手| 24山 分金 水口 论 吉凶| 百家乐官网赌博信息| 百家乐官网声音不印网| 宁国市| 真钱网络棋牌游戏| tt娱乐城开户|