異常檢測是什么?
“異常值(又名異常)是數據集中的觀察結果,它似乎與該數據集的其余部分不一致”——約翰遜 1992 年
“離群值是一種觀察結果,它與其他觀察結果的偏差如此之大,以至于引起人們懷疑它是由不同的機制產生的”——霍金斯 1980
異常是與常態不同、很少發生并且不符合“模式”其余部分的事件。異常包括,例如:
- 全球事件導致股市大幅下跌和上漲
- 工廠或傳送帶上的故障產品
- 污染的實驗室樣本
為什么要進行異常檢測?
計算機視覺中如何使用異常檢測?
一級圖像處理方法
基于傳統的圖像處理技術,例如邊緣檢測、特征檢測……和測量指標(例如,大小、顏色、位置、周長、圓度、形狀……)來描述一個物體 。
優點:無需培訓
缺點:沒有概括性
二級機器學習方法
機器學習算法使用計算方法直接從數據中“學習”信息,而不依賴于預先確定的方程式作為模型。
優點:更少的培訓
缺點:泛化程度較低
3 級深度學習方法
基于卷積神經網絡檢測異常值。訓練和推理需要大數據集和高效的硬件
優點:更泛化
缺點:更多培訓
小伙伴可能會問“我們應該選擇哪種方法呢?” 即使我們的問題與上面的情況完全不同也不必擔心,我們提供一個選擇的原則:
- 從圖像處理方法開始。如果數據具有低可變性,這可以提供可靠的解決方案。
- 在變量生產下,如果你有一個強大的 GPU 和大量標記的數據/圖像。然后,深度學習技術可以更好地處理更多數據,而 GPU 有助于減少訓練模型所需的時間。如果不是,那么 ML 方法是最佳選擇。
異常檢測和數據
異常檢測將如何在三種不同的情況下發生,具體取決于數據的情況。
監督:
在這種情況下,訓練數據被標記為“好”或“異常”(壞)。監督場景是理想的。這是為數據科學家精心準備的數據集,其中所有數據點都標記為異常或良好的情況。
資源用于結構化數據的流行 ML/DL 算法:
- 支持向量機學習
- k 最近鄰 (KNN)
- 貝葉斯網絡
- 決策樹
半監督:
在半監督場景中,所有數據都被假定為“好”,并且被“異常”(壞)數據點污染。
用于結構化數據的流行 ML/DL 算法:
- 自動編碼器
- 一類 SVM
- 高斯混合模型
- 核密度估計
無監督:
在無監督場景中,訓練數據是未標記的,由“好”和“異常”(壞)數據點組成。無監督場景中的數據集沒有將其部分標記為好或壞。
“無監督學習中最常見的任務是聚類、表示學習和密度估計。在所有這些情況下,我們都希望在不使用明確提供的標簽的情況下了解數據的固有結構。”
在無監督場景中,需要一組不同的工具來在非結構化數據中創建順序。非結構化數據的流行 ML/DL 算法是:
- 自組織映射 (SOM)
- K 均值
- C 均值
- 期望最大化元算法 (EM)
- 自適應共振理論 (ART)
- 一級支持向量機
異常檢測示例
App1:使用機器學習技術對無人機進行實時退化識別(Real time degradation identification of UAV using machine learning techniques)
在本文中,作者分析了無人機執行預定任務后的飛行數據流,并實時預測身體部位(在本例中為螺旋槳)的退化程度。
為了實現這一目標,他們使用 k 最近鄰算法作為分類算法,并使用動態時間規整作為距離度量來計算兩個航班塊之間的相似性。
App2:UAV-AdNet:使用深度神經網絡進行空中監視的無監督異常檢測(
UAV-AdNet: Unsupervised Anomaly Detection using Deep Neural Networks for Aerial Surveillance)
在本文中,作者提出了一種用于鳥瞰圖像環境表示的啟發式方法和一種基于 DNN 的異常檢測方法 (UAV-AdNet),該方法在環境表示和 GPS 標簽上聯合訓練。
在他們的實驗中,他們證明了所提出的架構在輸入的復制和裁剪連接下具有更好的場景重建性能。他們還觀察到,為網絡提供 GPS 數據可以增強異常檢測性能。
在他們的研究中,作者考慮了以下異常情況:
(1) 違反私人規則的物體:建筑物背面出現任何人或車輛。建筑物左側出現任何車輛
(2)違反公共規則的物體:行人只能使用斑馬線過馬路。自行車只能在自行車道上行駛。除自行車和摩托車外,其他車輛不得在自行車道上騎行或停放。
(3)尋找可疑物品
App3:監控環境中無人機錄制的視頻中的異常檢測(Anomaly Detection in Videos Recorded by Drones in a Surveillance Context)
本文專門研究了監視環境中的異常檢測,特別是針對由無人機錄制的監視視頻組成的微型無人機視頻數據集。本文提出的模型在 MDV 數據集上進行了評估。
盡管它很簡單,但該模型達到了最先進的性能。獲得的結果表明,這種應用程序的監督學習不太適合異常檢測。因為該模型未能檢測到它在 MDV 數據集訓練期間從未遇到過的情況,這是有問題的,因為即使不是不可能,也很難編譯代表許多實例的所有可能異常的數據集。
建議的異常檢測器是由卷積神經網絡和遞歸神經網絡組成的深度神經網絡,使用監督學習進行訓練。在他們未來的工作中,他們將專門檢查使用無監督學習訓練的模型設計,以減少對標記異常數據的需求。
App4:使用航空紅外熱成像技術自動檢測光伏電站:綜述(Automatic Inspection of Photovoltaic Power Plants Using Aerial Infrared Thermography: A Review)
提出一種使用空中紅外視頻進行自動光伏電站檢查的有效方法。
本文對光伏電站航空紅外熱成像 (aIRT) 框架不同任務自動化方法的文獻進行了全面回顧,因為這是近年來研究人員深入研究的課題。這些研究大多集中在視覺、IRT 和 aIRT 圖像中光伏電站的自主故障檢測和分類。在這些研究中,DL 算法的使用提供了良好的結果,在從 aIRT 圖像中提取的模塊段中檢測到的 10 種不同異常類型的故障檢測和分類中,準確率高達 90%。
然而,所開發算法的準確性、魯棒性和泛化性仍然是這些研究的主要挑戰,尤其是在處理更多類別的故障和大型光伏電站的檢查時。隨著公用事業規模光伏電站的容量和規模不斷增加,達到千兆瓦和數百公頃的規模,自動化越來越成為一個不僅具有科學意義而且具有經濟重要性的問題。因此,仍然必須探索自主程序和分類任務,以提高 aIRT 方法的準確性和適用性。
-
編碼器
+關注
關注
45文章
3669瀏覽量
135258 -
SVM
+關注
關注
0文章
154瀏覽量
32543 -
計算機視覺
+關注
關注
8文章
1700瀏覽量
46133 -
機器學習
+關注
關注
66文章
8441瀏覽量
133093 -
卷積神經網絡
+關注
關注
4文章
367瀏覽量
11917
發布評論請先 登錄
相關推薦
基于深度學習的異常檢測的研究方法
基于角度方差的數據流異常檢測算法
![基于<b class='flag-5'>角度</b>方差的數據流<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>算法](https://file.elecfans.com/web1/M00/44/FF/pIYBAFpew7-AGZKdAACwaKwXtew520.jpg)
什么是異常檢測_異常檢測的實用方法
基于用戶窗口行為的內部威脅異常檢測
![基于用戶窗口行為的內部威脅<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>](https://file.elecfans.com/web1/M00/ED/9A/pIYBAGCKby2AKPR2AAKZBBB7A1Y144.png)
基于視覺Transformer的監督視頻異常檢測架構進行腸息肉檢測的研究
FreeWheel基于機器學習的業務異常檢測實踐
使用MATLAB進行異常檢測(上)
哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型
![哈工大提出Myriad:利用<b class='flag-5'>視覺</b>專家進行工業<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>的大型多模態模型](https://file1.elecfans.com/web2/M00/AF/E1/wKgaomVcZciAd5fiAAAjfiZAZwc072.png)
評論