計(jì)算機(jī)視覺(jué)是指:讓機(jī)器通過(guò)數(shù)字圖像或視頻等視覺(jué)信息來(lái)模擬人類視覺(jué)的過(guò)程,以達(dá)到對(duì)物體的理解、識(shí)別、分類、跟蹤、重建等目的的技術(shù)。它是人工智能領(lǐng)域中的一個(gè)分支,涉及圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等多個(gè)領(lǐng)域。
隨著人工智能和機(jī)器學(xué)習(xí)算法進(jìn)入了與產(chǎn)業(yè)深度融合的階段,機(jī)器視覺(jué)技術(shù)已廣泛應(yīng)用于人臉識(shí)別、自動(dòng)駕駛、無(wú)人機(jī)、醫(yī)學(xué)影像分析、工業(yè)生產(chǎn)等場(chǎng)景,主要運(yùn)用到以下六大主流機(jī)器視覺(jué)技術(shù),一起來(lái)了解一下~
01 圖像分類
圖像分類是根據(jù)各自在圖像信息中所反映的不同特征,把不同類別的目標(biāo)區(qū)分開(kāi)來(lái)的圖像處理方法。它利用計(jì)算機(jī)對(duì)圖像進(jìn)行定量分析,把圖像或圖像中的每個(gè)像元或區(qū)域劃歸為若干個(gè)類別中的某一種,以代替人的視覺(jué)判讀。
常用方法:基于色彩特征的索引技術(shù)、基于紋理的圖像分類技術(shù)、基于形狀的圖像分類技術(shù)、基于空間關(guān)系的圖像分類技術(shù)等。
主要應(yīng)用:場(chǎng)景分類、物體識(shí)別、圖像標(biāo)注、醫(yī)學(xué)圖像、工業(yè)檢測(cè)和安防監(jiān)控等。
02 目標(biāo)檢測(cè)
目標(biāo)檢測(cè)是指在圖像或視頻中,識(shí)別出目標(biāo)物體所在的位置,并標(biāo)注出其所屬的類別的任務(wù)。相比于圖像分類任務(wù),目標(biāo)檢測(cè)需要對(duì)目標(biāo)的位置和數(shù)量進(jìn)行準(zhǔn)確的識(shí)別,因此其難度更大,但也更加實(shí)用。在實(shí)際應(yīng)用中,可以根據(jù)具體場(chǎng)景和需求,選擇不同的模型和算法來(lái)實(shí)現(xiàn)追蹤、識(shí)別和分析等目標(biāo)檢測(cè)任務(wù)。
常用模型:
①Faster R-CNN:是一種基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型,它通過(guò)在區(qū)域提議網(wǎng)絡(luò)(Region Proposal Network, RPN)中引入錨點(diǎn)來(lái)提高檢測(cè)速度,同時(shí)采用了RoI Pooling層來(lái)實(shí)現(xiàn)不同大小的目標(biāo)檢測(cè)。
②YOLO(You Only Look Once):是一種基于單階段目標(biāo)檢測(cè)算法的模型,它將目標(biāo)檢測(cè)任務(wù)轉(zhuǎn)化為一個(gè)回歸問(wèn)題,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)目標(biāo)的類別和位置。
③SSD(Single Shot MultiBox Detector):也是一種基于單階段目標(biāo)檢測(cè)算法的模型,通過(guò)在每個(gè)特征層上應(yīng)用不同大小和形狀的先驗(yàn)框,從而實(shí)現(xiàn)對(duì)不同尺度目標(biāo)的檢測(cè)。
主要應(yīng)用:
①智能安防:監(jiān)控場(chǎng)景中的人員和車(chē)輛,實(shí)現(xiàn)目標(biāo)追蹤和識(shí)別。
②自動(dòng)駕駛:通過(guò)識(shí)別道路標(biāo)志、交通信號(hào)燈、行人和其他車(chē)輛等來(lái)實(shí)現(xiàn)自主駕駛。
③無(wú)人機(jī):對(duì)無(wú)人機(jī)飛行區(qū)域中的目標(biāo)進(jìn)行識(shí)別和跟蹤,以實(shí)現(xiàn)智能控制和導(dǎo)航。
④工業(yè)制造:在生產(chǎn)過(guò)程中對(duì)產(chǎn)品進(jìn)行檢測(cè)和分類,提高生產(chǎn)效率和質(zhì)量。
⑤醫(yī)療診斷:通過(guò)對(duì)醫(yī)學(xué)圖像中的腫瘤等異常進(jìn)行識(shí)別和定位,輔助醫(yī)生進(jìn)行診斷和治療。
尤其是適用于邊緣端的智能應(yīng)用,比如在英碼科技的場(chǎng)景化解決方案中,主要通過(guò)邊緣計(jì)算盒子,結(jié)合機(jī)器視覺(jué)、大數(shù)據(jù)等技術(shù)實(shí)現(xiàn)長(zhǎng)尾場(chǎng)景的實(shí)時(shí)感知、目標(biāo)識(shí)別、監(jiān)測(cè)、預(yù)警等智能應(yīng)用,助力交通、校園、工地、化工園區(qū)等領(lǐng)域?qū)崿F(xiàn)智慧化升級(jí),達(dá)到降本增效的目的。
03 目標(biāo)跟蹤
目標(biāo)跟蹤是指在視頻序列中,對(duì)于已知的初始目標(biāo),在后續(xù)幀中通過(guò)對(duì)目標(biāo)的特征提取和跟蹤算法進(jìn)行處理,實(shí)現(xiàn)對(duì)目標(biāo)位置、形態(tài)等信息的實(shí)時(shí)跟蹤。
常用方法:
①基于相關(guān)濾波的跟蹤方法:將目標(biāo)與模板進(jìn)行相關(guān)性計(jì)算,計(jì)算得到的結(jié)果可以表示目標(biāo)在當(dāng)前幀的位置。
②基于粒子濾波的跟蹤方法:通過(guò)在目標(biāo)周?chē)S機(jī)生成多個(gè)粒子,然后根據(jù)目標(biāo)的運(yùn)動(dòng)模型,對(duì)這些粒子進(jìn)行預(yù)測(cè),再用觀測(cè)信息對(duì)預(yù)測(cè)的粒子進(jìn)行權(quán)重更新,最終選擇權(quán)重最高的粒子來(lái)表示目標(biāo)的位置。
③基于深度學(xué)習(xí)的跟蹤方法:使用深度學(xué)習(xí)算法對(duì)目標(biāo)進(jìn)行特征提取和表示,然后根據(jù)目標(biāo)在前一幀的位置和特征,對(duì)目標(biāo)在當(dāng)前幀的位置進(jìn)行預(yù)測(cè)。常用的深度學(xué)習(xí)跟蹤算法包括循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等。
主要應(yīng)用:目標(biāo)跟蹤技術(shù)適用于視頻監(jiān)控、無(wú)人駕駛、智能交通等領(lǐng)域,可以用于目標(biāo)的實(shí)時(shí)跟蹤和識(shí)別,實(shí)現(xiàn)自動(dòng)化控制和智能化分析。
04 語(yǔ)義分割
語(yǔ)義分割旨在將輸入圖像中的每個(gè)像素標(biāo)記為屬于哪個(gè)語(yǔ)義類別。與目標(biāo)檢測(cè)和圖像分類不同,語(yǔ)義分割不僅可以識(shí)別圖像中的物體,還可以為每個(gè)像素分配標(biāo)簽,從而提供更詳細(xì)和準(zhǔn)確的圖像理解。
常用模型:FCN(Fully Convolutional Network)、U-Net、DeepLab等。近年來(lái)還涌現(xiàn)出了許多基于深度學(xué)習(xí)的新型語(yǔ)義分割模型,如PSPNet、DeepLab V3+等,它們?cè)诰群托实确矫娑加兴岣摺?/p>
主要應(yīng)用:語(yǔ)義分割適用于需要對(duì)圖像進(jìn)行精細(xì)分割和像素級(jí)分類的場(chǎng)景,例如自動(dòng)駕駛中的道路分割、醫(yī)學(xué)圖像中的病變分割、地理信息系統(tǒng)中的土地分類等。
05 實(shí)例分割
實(shí)例分割是結(jié)合目標(biāo)檢測(cè)和語(yǔ)義分割的一個(gè)更高層級(jí)的任務(wù)。實(shí)例分割是計(jì)算機(jī)視覺(jué)中的一項(xiàng)任務(wù),旨在同時(shí)檢測(cè)圖像中的物體,并將每個(gè)物體分割成精確的像素級(jí)別的區(qū)域。與語(yǔ)義分割不同,實(shí)例分割不僅可以分割出不同類別的物體,還可以將它們分割成獨(dú)立的、像素級(jí)別的區(qū)域。
常用模型:Mask R-CNN、FCIS(Fully Convolutional Instance-aware Semantic Segmentation)、SOLO(Segmenting Objects by Locations)等。
主要應(yīng)用:實(shí)例分割適用于需要對(duì)圖像進(jìn)行精細(xì)分割并區(qū)分不同物體的場(chǎng)景,例如自動(dòng)駕駛中的行人和車(chē)輛分割、醫(yī)學(xué)圖像中的器官分割、遙感圖像中的建筑物分割等。
結(jié)語(yǔ)
上述這 5 種關(guān)鍵的機(jī)器視覺(jué)技術(shù)可以協(xié)助計(jì)算機(jī)從單個(gè)或一系列圖像中提取、分析和理解有用的信息,賦能千行百業(yè)實(shí)現(xiàn)AI應(yīng)用,構(gòu)建更智能、美好的視界。
審核編輯 黃宇
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4781瀏覽量
101178 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
162文章
4406瀏覽量
120744 -
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270358
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
鴻道Intewell工業(yè)操作系統(tǒng),三大關(guān)鍵技術(shù),領(lǐng)跑行業(yè)前沿
云計(jì)算HPC軟件關(guān)鍵技術(shù)
華為發(fā)布兩大關(guān)鍵創(chuàng)新技術(shù)方向
焊接機(jī)器人智能化的關(guān)鍵技術(shù)有哪些
![焊接<b class='flag-5'>機(jī)器</b>人智能化的<b class='flag-5'>關(guān)鍵技術(shù)</b>有哪些](https://file1.elecfans.com//web1/M00/F4/56/wKgZoWcpvLOAYOAxAALww0wyUik578.jpg)
機(jī)器視覺(jué)檢測(cè)系統(tǒng)的關(guān)鍵技術(shù)和應(yīng)用場(chǎng)景
機(jī)器視覺(jué)技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用
什么是工業(yè)機(jī)器視覺(jué)?它有哪些作用?
機(jī)器視覺(jué)檢測(cè)技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用
機(jī)器視覺(jué)的關(guān)鍵技術(shù)有哪些
機(jī)器視覺(jué)系統(tǒng)與運(yùn)動(dòng)控制系統(tǒng)的區(qū)別
儲(chǔ)能BMS的關(guān)鍵技術(shù)是什么
高通賦能互聯(lián)未來(lái):5G Advanced Release 18中的五大關(guān)鍵技術(shù)發(fā)明
![高通賦能互聯(lián)未來(lái):<b class='flag-5'>5</b>G Advanced Release 18中的五<b class='flag-5'>大關(guān)鍵技術(shù)</b>發(fā)明](https://file1.elecfans.com/web2/M00/E7/34/wKgaomZGr5uALILMAAAa3IvOkAA901.png)
MOS管發(fā)熱的五大關(guān)鍵技術(shù)
機(jī)器視覺(jué)缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù)
![<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b>缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)<b class='flag-5'>關(guān)鍵技術(shù)</b>](https://file1.elecfans.com/web2/M00/BD/12/wKgaomWfs2WAEkhfAAWpTKcwj9A789.png)
評(píng)論