吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

淺談機器學習中的異常檢測應用

中科院長春光機所 ? 來源:極市平臺 ? 作者:極市平臺 ? 2020-10-29 11:26 ? 次閱讀

一、簡介

異常檢測一直是機器學習中一個非常重要的子分支,在各種人工智能落地應用例如計算機視覺、數(shù)據(jù)挖掘、NLP中,異常檢測算法都是很熱門的研究方向,特別是大數(shù)據(jù)時代,人工處理數(shù)據(jù)的速度已經(jīng)遠遠趕不上機器了,所以更快地檢測數(shù)據(jù)中的異常情況成為了我們當下非常重要的任務。在深度學習廣泛的推廣之前,傳統(tǒng)的異常檢測算法有很多,例如高斯擬合,半監(jiān)督學習等等,而在深度學習大火之后,人們也開始研究將深度學習應用于各種異常任務中(也就是Deep Anomaly Detection,以下統(tǒng)稱DAD),并取得了很大的成功,本文將把當下該方向熱門的研究方向分類并列舉了對應的文章,希望能幫助大家更好地理解此方向的研究。

二、異常檢測的概念

異常檢測,從定義而言就是一種識別不正常情況與挖掘非邏輯數(shù)據(jù)的技術,也叫outliers。例如在計算機視覺的應用中,有人在抖音發(fā)表一個視屏,在邊騎車邊打電話,那這就是個不符合規(guī)范的視屏,我們能否采用一些方式來將其檢測出來,再例如在數(shù)據(jù)挖掘領域中,那異常檢測的應用就更廣泛了,比如信用卡盜刷,超大金額支出等等。通常情況下,在我們閱讀論文的過程中,異常檢測(Anomaly Detection)也被叫做,Novelty Detection,Outlier Detection,F(xiàn)orgery Detection,Out-of-distribution Detection。在閱讀論文的情況,這些名詞也有輕微的區(qū)別,以計算機視覺為例,如下圖所示。

在計算機視覺的基本任務——圖像分類中,單分類與多分類問題,將幾種概念的細微區(qū)別基本闡述清楚了。Anomaly Detection指在不屬于該分類的數(shù)據(jù)集中,而Novelty是檢測可能屬于該分類但卻沒見過(Unseen)也就是Novel的數(shù)據(jù)集,而OOD(out-of-distribution)則是多分類中不同目標的分布,這些任務在接下來的論文中,也經(jīng)常有人進行相應的研究。

三、異常檢測相關工作與方向

首先根據(jù)查閱異常檢測方向綜述的文章,我將基于深度學習的異常檢測應用方向論文,按照主要的邏輯結(jié)構(gòu)列舉在了下面,我相信這可以更加方便地向你展示異常檢測方向你應該怎樣去研究你的論文。

1. DAD研究的主要元素

(1) 異常數(shù)據(jù)集

點集

連續(xù)集

團隊集

(2) 異常檢測模型

無監(jiān)督學習、AutoEncoder、GAN、矩陣因子分解

半監(jiān)督學習、強化學習

Hybrid(混種)、特征提取+傳統(tǒng)算法

單分類神經(jīng)網(wǎng)絡

(3) 異常檢測應用

詐騙檢測

網(wǎng)絡侵入檢測

醫(yī)學異常檢測

傳感器網(wǎng)絡異常檢測

視屏監(jiān)督

物聯(lián)網(wǎng)大數(shù)據(jù)異常檢測

日志異常檢測

工業(yè)危害檢測

2. 異常檢測論文分類

下面也是我根據(jù)參考文獻,把異常檢測論文分成幾個當前研究方向,相當于列出了一個目錄在這里,可供之后方便查看,關于論文分類的一些概念,我會在下面的介紹中詳細提及。

(1) 數(shù)據(jù)的連續(xù)性

(2) 數(shù)據(jù)標簽的可用性

監(jiān)督學習Supervised Learning

半監(jiān)督學習Semi-supervised Learning

無監(jiān)督學習Unsupervised Learning

(3) 基于訓練對象的模型

深度混種模型Deep Hybrid Model(DHM)

單分類神經(jīng)網(wǎng)絡One-Class Neural Networks(OC-NN)

(4) 數(shù)據(jù)異常類型

點集Point

連續(xù)集Contextual

團隊集Collective or Group

(5) 異常檢測輸出類型

異常分數(shù)Anomaly Score

標簽Lable

(6) 異常檢測應用

有將近十種異常檢測相關的應用,由于目前對該部分研究較淺,所以之后會考慮單獨寫篇文章來總結(jié)異常檢測方面的應用型論文。

四、原始數(shù)據(jù)的連續(xù)性Nature of Input Data

在DAD問題中選擇怎樣的網(wǎng)絡結(jié)構(gòu)很大部分取自于原始數(shù)據(jù)(raw/input data)的類型,原始數(shù)據(jù)在廣義上我們可以分為連續(xù)型(Sequential)與非連續(xù)型(Non-sequential),如何選擇相應的模型,我列舉在下表中。

原始數(shù)據(jù)類型 舉例 DAD模型選擇
連續(xù)型Sequential 視屏,DNA序列,自然語言文本 CNN,RNN,LSTM
非連續(xù)型Non-sequential 圖片,傳感器 CNN,AE及其變種

DAD在未降維的高維原始數(shù)據(jù)中表現(xiàn)優(yōu)異,成功提取大規(guī)模數(shù)據(jù)的關系,通常情況下,網(wǎng)絡越深,提取效果越好,這個部分感興趣的話可以參考下面這篇文章。

Yann LeCun, Yoshua Bengio, and Geoffrey Hinton. Deep learning. nature, 521(7553):436, 2015.

五、數(shù)據(jù)標簽的可用性Availability of Labels

數(shù)據(jù)標簽是非常重要的事情,標簽代表著正常(normal)數(shù)據(jù)或是未見過(unseen/novel)的數(shù)據(jù),對于標簽內(nèi)容的使用同樣是現(xiàn)在異常檢測方向論文重點考慮的事情。異常檢測的模型也可以根據(jù)數(shù)據(jù)標簽的內(nèi)容廣義的分為三類,監(jiān)督,半監(jiān)督和無監(jiān)督。

1. 監(jiān)督Supervised DAD

基于監(jiān)督學習的DAD文章,整理了兩篇醫(yī)學方向的,由于監(jiān)督學習對于標簽內(nèi)容的依賴度過重,所以他對于異常檢測的問題并不是那么合適,所以它并不如半監(jiān)督和無監(jiān)督應用地那么廣泛。

Raghavendra Chalapathy, Ehsan Zare Borzeshi, and Massimo Piccardi. An investigation of recurrent neural architectures for drug name recognition. arXiv preprint arXiv:1609.07585, 2016a.

Raghavendra Chalapathy, Ehsan Zare Borzeshi, and Massimo Piccardi. Bidirectional lstm-crf for clinical concept extraction. arXiv preprint arXiv:1611.08373, 2016b.

2. 半監(jiān)督Semi-supervised DAD

由于正常數(shù)據(jù)集比異常數(shù)據(jù)集更好獲得,所以半監(jiān)督學習DAD方法被非常廣泛的使用,擁有了足夠的數(shù)據(jù)集,我們能更好地標出正常數(shù)據(jù),異常數(shù)據(jù),新數(shù)據(jù)的界限,半監(jiān)督學習模型列舉三篇論文。

Drausin Wulsin, Justin Blanco, Ram Mani, and Brian Litt. Semi-supervised anomaly detection for eeg waveforms using deep belief nets. In Machine Learning and Applications (ICMLA), 2010 Ninth International Conference on, pages 436–441. IEEE, 2010.

Mutahir Nadeem, Ochaun Marshall, Sarbjit Singh, Xing Fang, and Xiaohong Yuan. Semi-supervised deep neural network for network intrusion detection. 2016.

Hongchao Song, Zhuqing Jiang, Aidong Men, and Bo Yang. A hybrid semi-supervised anomaly detection model for high-dimensional data. Computational intelligence and neuroscience, 2017.

3. 無監(jiān)督Unsupervised DAD

傳統(tǒng)機器學習算法其實我感覺更傾向于直接從數(shù)據(jù)集中讓機器去學習一些東西,然后直接用參數(shù)的方式表示出來,異常檢測問題同樣我們也用自動標簽的方式去檢測是否異常,因為有時候可能數(shù)據(jù)難以獲取。自動解碼器是無監(jiān)督DAD的核心,所以這里深度學習的一些神經(jīng)網(wǎng)絡大有可為,例如RNN,LSTM等等。我們這里只列舉了一種采用變種半監(jiān)督學習方法的論文,應用于異常數(shù)據(jù)降維,表現(xiàn)效果超越很多傳統(tǒng)降維算法,如PCA,Isolation等等。

Aaron Tuor, Samuel Kaplan, Brian Hutchinson, Nicole Nichols, and Sean Robinson. Deep learning for unsupervised insider threat detection in structured cybersecurity data streams. arXiv preprint arXiv:1710.00811, 2017.

六、基于訓練對象的模型

按照訓練對象的區(qū)別,我們把訓練模型單獨劃分為兩類,變種模型與單分類神經(jīng)網(wǎng)絡。

1. 深度變種模型Deep Hybrid Models(DHM)

Jerone TA Andrews, Edward J Morton, and Lewis D Griffin. Detecting anomalous data using auto-encoders. International Journal of Machine Learning and Computing, 6(1):21, 2016a.

Tolga Ergen, Ali Hassan Mirza, and Suleyman Serdar Kozat. Unsupervised and semi-supervised anomaly detection with lstm neural networks. arXiv preprint arXiv:1710.09207, 2017.

2. 單分類神經(jīng)網(wǎng)絡One-Class Neural Networks(OC-NN)

Raghavendra Chalapathy, Aditya Krishna Menon, and Sanjay Chawla. Anomaly detection using one-class neural networks. arXiv preprint arXiv:1802.06360, 2018a.

七、數(shù)據(jù)異常類型

1. 點集Point

舉信用卡盜刷的例子,點集異常就是指單筆交易大金額支出,比如你都花1塊2塊的錢,突然有一天消費了1k,那可能就出現(xiàn)了異常情況,但這個方向好像沒有人單獨發(fā)過文章。

2. 連續(xù)集Contextual or Conditional

連續(xù)集就是指上下文相關的連續(xù)數(shù)據(jù),某一個中間數(shù)據(jù)出現(xiàn)了異常情況,可能引起了梯度消失爆炸等等問題。

Xiuyao Song, Mingxi Wu, Christopher Jermaine, and Sanjay Ranka. Conditional anomaly detection. IEEE Transactions on Knowledge and Data Engineering, 19(5):631–645, 2007.

3. 團隊集Collective or Group

還是信用卡盜刷的例子,如果某天你的信用卡突然短時間內(nèi)不停地消費50元,那機器可能會發(fā)現(xiàn),這些團隊數(shù)據(jù)集的消費出現(xiàn)了異常,這種情況我們也在其他場合經(jīng)常遇到。

Raghavendra Chalapathy, Edward Toth, and Sanjay Chawla. Group anomaly detection using deep generative models. arXiv preprint arXiv:1804.04876, 2018b.

Lo¨?c Bontemps, James McDermott, Nhien-An Le-Khac, et al. Collective anomaly detection based on long short-term memory recurrent neural networks. In International Conference on Future Data and Security Engineering, pages 141–152. Springer, 2016.

Daniel B Araya, Katarina Grolinger, Hany F ElYamany, Miriam AM Capretz, and G Bitsuamlak. Collective contextual anomaly detection framework for smart buildings. In Neural Networks (IJCNN), 2016 International Joint Conference on, pages 511–518. IEEE, 2016.

Naifan Zhuang, Tuoerhongjiang Yusufu, Jun Ye, and Kien A Hua. Group activity recognition with differential recurrent convolutional neural networks. In Automatic Face & Gesture Recognition (FG 2017), 2017 12th IEEE International Conference on, pages 526–531. IEEE, 2017.

八、idea新穎的論文

這里我再給大家推薦8篇idea比較新穎的論文,可供大家閱讀與交流。

[1] Liu W, Luo W, Lian D, et al. Future frame prediction for anomaly detection–a new baseline[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6536-6545.

[2] Gong D, Liu L, Le V, et al. Memorizing normality to detect anomaly: Memory-augmented deep autoencoder for unsupervised anomaly detection[C]//Proceedings of the IEEE International Conference on Computer Vision. 2019: 1705-1714.

[3] Park H, Noh J, Ham B. Learning Memory-guided Normality for Anomaly Detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 14372-14381.

[4] Zhao Y, Deng B, Shen C, et al. Spatio-temporal autoencoder for video anomaly detection[C]//Proceedings of the 25th ACM international conference on Multimedia. 2017: 1933-1941.

[5] Ionescu R T, Khan F S, Georgescu M I, et al. Object-centric auto-encoders and dummy anomalies for abnormal event detection in video[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 7842-7851.

[6] Liu W, Luo W, Li Z, et al. Margin Learning Embedded Prediction for Video Anomaly Detection with A Few Anomalies[C]//IJCAI. 2019: 3023-3030.

[7] Sultani W, Chen C, Shah M. Real-world anomaly detection in surveillance videos[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6479-6488.

[8] Luo W, Liu W, Gao S. A revisit of sparse coding based anomaly detection in stacked rnn framework[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 341-349.

九、最后總結(jié)

最后給大家推薦一個超級nice的github倉庫,里面的文章都比較新,并且也進行了一些分類。

https://github.com/hoya012/awesome-anomaly-detection

文章轉(zhuǎn)自“極市平臺”

責任編輯:PSY

原文標題:異常檢測(Anomaly Detection)綜述

文章出處:【微信公眾號:中科院長春光機所】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 異常檢測
    +關注

    關注

    1

    文章

    42

    瀏覽量

    9755
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240336
  • 機器學習
    +關注

    關注

    66

    文章

    8441

    瀏覽量

    133094

原文標題:異常檢測(Anomaly Detection)綜述

文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    zeta在機器學習的應用 zeta的優(yōu)缺點分析

    在探討ZETA在機器學習的應用以及ZETA的優(yōu)缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據(jù)不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發(fā)表于 12-20 09:11 ?365次閱讀

    cmp在機器學習的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?309次閱讀

    eda在機器學習的應用

    機器學習項目中,數(shù)據(jù)預處理和理解是成功構(gòu)建模型的關鍵。探索性數(shù)據(jù)分析(EDA)是這一過程不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機器學習
    的頭像 發(fā)表于 11-13 10:42 ?397次閱讀

    魯棒性在機器學習的重要性

    機器學習領域,模型的魯棒性是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r,仍能保持性能的能力。隨著人工智能技術的快速發(fā)展,機器學習
    的頭像 發(fā)表于 11-11 10:19 ?560次閱讀

    基于機器學習的IWR6843AOP跌倒和姿態(tài)檢測實現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《基于機器學習的IWR6843AOP跌倒和姿態(tài)檢測實現(xiàn).pdf》資料免費下載
    發(fā)表于 09-03 10:02 ?1次下載
    基于<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的IWR6843AOP跌倒和姿態(tài)<b class='flag-5'>檢測</b>實現(xiàn)

    機器視覺在焊接質(zhì)量檢測的應用

    的可能性。今天跟隨創(chuàng)想智控小編一起了解機器視覺在焊接質(zhì)量檢測的應用。 1. 機器視覺原理 機器視覺是一種利用計算機技術對圖像進行分析和處理
    的頭像 發(fā)表于 08-13 16:33 ?346次閱讀

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    如何通過根因分析技術獲得導致故障的維度和元素,包括基于時間序列異常檢測算法的根因分析、基于熵的根因分析、基于樹模型的根因分析、規(guī)則學習等。 ●第7章“智能運維的應用場景”:介紹智能運維領域的應用,包括
    發(fā)表于 08-07 23:03

    機器學習的數(shù)據(jù)分割方法

    機器學習,數(shù)據(jù)分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發(fā)表于 07-10 16:10 ?2136次閱讀

    如何理解機器學習的訓練集、驗證集和測試集

    理解機器學習的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學習
    的頭像 發(fā)表于 07-10 15:45 ?4672次閱讀

    深度學習在工業(yè)機器視覺檢測的應用

    隨著深度學習技術的快速發(fā)展,其在工業(yè)機器視覺檢測的應用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機器視覺檢測
    的頭像 發(fā)表于 07-08 10:40 ?1233次閱讀

    深度學習在視覺檢測的應用

    深度學習機器學習領域中的一個重要分支,其核心在于通過構(gòu)建具有多層次的神經(jīng)網(wǎng)絡模型,使計算機能夠從大量數(shù)據(jù)自動學習并提取特征,進而實現(xiàn)對復
    的頭像 發(fā)表于 07-08 10:27 ?881次閱讀

    機器學習在數(shù)據(jù)分析的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數(shù)據(jù)中學習規(guī)律,為企業(yè)和組織提供了更高效、更準確的數(shù)據(jù)分析能力。本文將深入探討機器
    的頭像 發(fā)表于 07-02 11:22 ?813次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮機器學習和深度學習無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發(fā)表于 07-01 11:40 ?1541次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    應用,將理論基礎與實踐案例相結(jié)合,作者憑借扎實的數(shù)學功底及其在企業(yè)界的豐富實踐經(jīng)驗,將機器學習與時間序列分析巧妙融合在書中。 全書書共分為8章,系統(tǒng)介紹時間序列的基礎知識、常用預測方法、異常
    發(fā)表于 06-25 15:00

    機器視覺在焊縫檢測的應用

    。為了解決這些問題,機器視覺技術被引入到焊縫檢測,提供了一種高效、準確且可重復的解決方案。 機器視覺的基本原理 機器視覺
    的頭像 發(fā)表于 05-20 11:10 ?483次閱讀
    威斯汀百家乐的玩法技巧和规则| 免费百家乐倍投| 大发888游戏平台下载| 安宁市| 真人百家乐官网源代码| 百家乐重要心态| 超级老虎机系统| 单张百家乐官网论坛| 国际娱百家乐官网的玩法技巧和规则 | 怎么赌百家乐能赢| 开心8娱乐城| 菲律宾百家乐官网赌场娱乐网规则| 百家乐娱乐城赌场| 天鸿德州扑克游戏币| 长方形百家乐官网筹码| 百家乐平注赢钱法| 百家乐代理 | LV百家乐官网赢钱LV| 水浒传老虎机破解| 百家乐官网在线娱乐场| 深圳百家乐的玩法技巧和规则| 桦南县| 什么是百家乐赌博| 盈丰| 百家乐官网衬衣| 东京太阳城王子大酒店| 澳门百家乐官网庄闲的玩法| 百家乐游戏唯一官网站| 邢台县| 百家乐园鼎盛娱乐场| 长宁区| 百家乐棋牌正式版| 垣曲县| 百家乐扫瞄光纤洗牌机扑克洗牌机扑克洗牌机 | 百家乐官网遥控牌靴| 百家乐鸿泰棋牌| 蛟河市| 网上百家乐娱乐网| 皇冠网百家乐官网赢钱| 百家乐怎么完才能嬴| 金赞百家乐官网现金网|