完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

如何解決數據稀疏而對深度學習的影響問題？詳細方法概述

深度學習，有太多令人驚嘆的能力！從12年的圖像識別開始，深度學習的一個個突破，讓人們一次又一次的刷新對它的認知。然而，應用深度學習，一直有一個巨大的前提：大量標注數據。但是難道數據少，就享受不到深度學習帶來的紅利了么？近日來自卡內基梅隆大學、亞馬遜研究院、加州理工學院的研究員，在人工智能頂級會議 UAI 上闡述了多種方法，嘗試緩解甚至解決數據稀疏對深度學習的影響。

主要方法

為了解決深度學習數據少，和數據稀疏，目前業界的主流方法有一下5種：

數據增廣

半監督學習

遷移學習

領域自適應

主動學習

下面，我們對這5種方式進行一個簡單的介紹，詳細的介紹.

數據增廣

數據增廣，主要是想，對現有的數據，添加噪聲等各種其他變換，從而產生一些有意義的數據，是的數據集增加，從而解決數據稀疏的問題，提升模型性能。特別的，如圖所示，Zachary Lipton 介紹了近期他的一個工作：利用 GAN來做圖像數據增廣。

半監督學習

半監督學習的情形是指：我們擁有少量的標注樣本（圖中橘色部分）以及大量的未標注樣本（圖中藍色部分）。

半監督學習，一般的思路是：在全部數據上去學習數據表示，在有標簽的樣本上去學習模型，用所有數據去加正則。

遷移學習

遷移學習，主要是想，在一個擁有大量樣本的數據(圖中藍色部分)上去學習模型，在改動較少的情況下，將學習到的模型遷移到類似的目標數據(圖中橘色部分)和任務上。

領域自適應

領域自適應，主要是想，在已有的標注數據p(x,y)上學習模型, 然后嘗試在另一個分布上q(x，y)上去做應用。

主動學習

主動學習，維護了兩個部分：學習引擎和選擇引擎。學習引擎維護一個基準分類器，并使用監督學習算法對系統提供的已標注樣例進行學習從而使該分類器的性能提高，而選擇引擎負責運行樣例選擇算法選擇一個未標注的樣例并將其交由人類專家進行標注，再將標注后的樣例加入到已標注樣例集中。學習引擎和選擇引擎交替工作，經過多次循環，基準分類器的性能逐漸提高，當滿足預設條件時，過程終止。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像識別

圖像識別

+關注

關注
9

文章
521

瀏覽量
38386
GaN

GaN

+關注

關注
19

文章
1965

瀏覽量
74223
深度學習

深度學習

+關注

關注
73

文章
5513

瀏覽量
121544

原文標題：數據少，就享受不到深度學習的紅利了么？總是有辦法的！

文章出處：【微信號：CAAI-1981，微信公眾號：中國人工智能學會】歡迎添加關注！文章轉載請注明出處。

基于稀疏編碼的遷移學習及其在行人檢測中的應用

一定進展,但大都需要大量的訓練數據.針對這一問題,提出了一種基于遷移學習的半監督行人分類方法:首先基于稀疏編碼,從任意的未標記樣本中,學習到

發表于 04-24 09:48

基于深度學習的異常檢測的研究方法

異常檢測的深度學習研究綜述原文：arXiv:1901.03407摘要異常檢測是一個重要的問題，在不同的研究領域和應用領域都得到了很好的研究。本文的研究目的有兩個：首先，我們對基于深度學習

發表于 07-12 07:10

基于深度學習的異常檢測的研究方法

ABSTRACT1.基于深度學習的異常檢測的研究方法進行結構化和全面的概述2.回顧這些方法在各個領域這個中的應用情況，并評估他們的有效性。3

發表于 07-12 06:36

深度學習在IoT大數據和流分析中的應用

這篇論文對于使用深度學習來改進IoT領域的數據分析和學習方法進行了詳細的綜述。

發表于 03-01 11:05 ?7794次閱讀

如何使用極端學習機進行人臉特征深度稀疏自編碼的詳細方法概述

人臉圖像的稀疏特征;其次，利用極端學習機自編碼器（ ELM-AE）模型進行人臉特征的自編碼，實現數據維度的降低以及噪聲過濾;最后，通過經驗風險極小化得到最優的深度結構。在ORL、IMM

發表于 11-27 16:02 ?3次下載

LTE的結構是怎樣的LTE承載網如何解決詳細方案概述

本文檔的主要內容詳細介紹的是LTE的結構是怎樣的LTE承載網如何解決詳細方案概述主要內容包括了：LTE的結構與技術特征，LTE對承載網的需求，LTE承載網PTN的解決方案。

發表于 12-11 13:59 ?13次下載

深度學習優化器方法及學習率衰減方式的詳細資料概述

下降、Adagrad、RMSProp、Adadelta、Adam、Nadam、ANGD等優化方法，也對學習率的衰減方式有分段常數衰減、多項式衰減、指數衰減、自然指數衰減、余弦衰減、線性余弦衰減、噪聲線性余弦衰減等方法進行了總結，

發表于 12-18 16:47 ?9次下載

針對線性回歸模型和深度學習模型，介紹了確定訓練數據集規模的方法

具體來看，對于傳統的機器學習算法，模型的表現先是遵循冪定律（power law），之后趨于平緩；而對于深度學習，該問題還在持續不斷地研究中，不過圖一為目前較為一致的結論，即隨著

發表于 05-05 11:03 ?6258次閱讀

什么？不用GPU也能加速你的YOLOv3深度學習模型

你還在為神經網絡模型里的冗余信息煩惱嗎？或者手上只有CPU，對一些只能用昂貴的GPU建立的深度學習模型“望眼欲穿”嗎？最近，創業公司Neural Magic帶來了一種名叫新的稀疏化方法

發表于 06-10 15:33 ?2348次閱讀

稀疏濾色器圖案概述

稀疏濾色器圖案概述

發表于 11-15 20:35 ?0次下載

深度學習的由來深度學習的經典算法有哪些

深度學習作為機器學習的一個分支，其學習方法可以分為監督學習和無監督學習。兩種

發表于 10-09 10:23 ?572次閱讀

深度學習的模型優化與調試方法

深度學習模型在訓練過程中，往往會遇到各種問題和挑戰，如過擬合、欠擬合、梯度消失或爆炸等。因此，對深度學習模型進行優化與調試是確保其性能優越的關鍵步驟。本文將從

發表于 07-01 11:41 ?1000次閱讀

基于Python的深度學習人臉識別方法

基于Python的深度學習人臉識別方法是一個涉及多個技術領域的復雜話題，包括計算機視覺、深度學習、以及圖像處理等。在這里，我將

發表于 07-14 11:52 ?1323次閱讀

精選推薦
更多

文章

資料

帖子

穿過幻覺荒野，大模型RAG越野賽

腦極體
8天前

2160 閱讀

春節返鄉，記得帶上這全國34個省的AI人脈……

腦極體
8天前

2175 閱讀

先進電動汽車的電壓轉換策略在48V電動汽車供電網絡中部署區域架構

Vicor
12天前

2831 閱讀

解析汽車拋負載Load Dump：load dump產生原因與TVS并聯保護方案

力特奧維斯Littelfuse
12天前

2768 閱讀

泰克示波器在直流充電樁電流紋波測試中的應用

泰克科技
12天前

2651 閱讀

主板復位電路及VRM電路原理分析

yezi888
542 KB

免費

136下載

手機雙處理器開發板代碼及高級教程和資料下載鏈接

o_dream
10.08 MB

免費

10下載

TiDB Operator自動化部署運維工具

凌流浪
2.50 MB

免費

0下載

Sublime Web Inspector JS調試器

大彭
0.09 MB

2積分

1下載

Paddle Lite飛槳多平臺高性能深度學習預測引擎

jefljel
10.07 MB

免費

0下載

RK3588 原廠設計資料首次公開（規格書+原理圖+設計說明+DDR參考），速搶

h1654155861.7375
19小時前

94 閱讀

【貝啟科技BQ3568HM開源鴻蒙開發板深度試用報告】2-上電體驗

jf_36765885
19小時前

98 閱讀

推薦一款三相三線制電源模組

硬件設計小菜
19小時前

271 閱讀

rockchip rk3576開發設計資料

h1654155861.7375
19小時前

242 閱讀

反激開關電源工作原理

jf_84115621
19小時前

207 閱讀

推薦專欄
更多

吴忠躺衫网络科技有限公司

搜索歷史

如何解決數據稀疏而對深度學習的影響問題？詳細方法概述

評論

基于稀疏編碼的遷移學習及其在行人檢測中的應用

利用ECS進行深度學習詳細攻略

稀疏表示和字典學習是什么

基于深度學習的異常檢測的研究方法

基于深度學習的異常檢測的研究方法

深度學習在IoT大數據和流分析中的應用

如何使用極端學習機進行人臉特征深度稀疏自編碼的詳細方法概述

LTE的結構是怎樣的LTE承載網如何解決詳細方案概述

深度學習優化器方法及學習率衰減方式的詳細資料概述

針對線性回歸模型和深度學習模型，介紹了確定訓練數據集規模的方法

什么？不用GPU也能加速你的YOLOv3深度學習模型

稀疏濾色器圖案概述

深度學習的由來深度學習的經典算法有哪些

深度學習的模型優化與調試方法

基于Python的深度學習人臉識別方法