吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像標注的種類,應(yīng)用場景,以及各種標注的優(yōu)缺點

新機器視覺 ? 來源:AI公園 ? 作者:AI公園 ? 2020-12-28 14:09 ? 次閱讀

導(dǎo)讀

本文從五個需要進行標注的計算機視覺任務(wù)(物體檢測、線/邊緣檢測、分割、姿態(tài)預(yù)測、圖像分類)給大家介紹圖像標注的種類,應(yīng)用場景,以及各種標注的優(yōu)缺點。

介紹

“如果沒有數(shù)據(jù)分析,公司就會變得既盲又聾,就像高速公路上的鹿一樣在網(wǎng)絡(luò)上游蕩。”

— Geoffrey Moore

每個數(shù)據(jù)科學任務(wù)都需要數(shù)據(jù)。具體地說,是輸入系統(tǒng)的干凈易懂的數(shù)據(jù)。說到圖像,計算機需要看到人類眼睛看到的東西。

例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機視覺來解釋它接收到的視覺數(shù)據(jù)。這就是圖像標注的作用。

圖像標注在計算機視覺中起著至關(guān)重要的作用。圖像標注的目標是為和任務(wù)相關(guān)的、特定于任務(wù)的標簽。這可能包括基于文本的標簽(類),繪制在圖像上的標簽(即邊框),甚至是像素級的標簽。我們將在下面探討這一系列不同的標注技術(shù)。

人工智能需要的人工干預(yù)比我們想象的要多。為了準備高精度的訓(xùn)練數(shù)據(jù),我們必須對圖像進行標注以得到正確的結(jié)果。數(shù)據(jù)注釋通常需要較高水平的領(lǐng)域知識,只有來自特定領(lǐng)域的專家才能提供這些知識。

需要標注的計算機視覺任務(wù):

物體檢測

線/邊緣檢測

分割

姿態(tài)預(yù)測/關(guān)鍵點識別

圖像分類

1) 目標檢測

進行目標檢測的技術(shù)主要有兩種,即2D和3D包圍框。

對于多邊形物體,可以使用多邊形方法。讓我們詳細討論一下。

2D 包圍框

在這種方法中,只需要在被檢測的物體周圍繪制矩形框。它們用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標和右下角的x、y軸坐標來確定。

優(yōu)點和缺點:

標注起來快速和容易。

不能提供重要的信息,如物體的方向,這對許多應(yīng)用來說是至關(guān)重要的。

包括不屬于物體一部分的背景像素。這可能會影響訓(xùn)練。

3D 包圍框或者立方體

類似于2D邊框,除了它們還可以顯示目標的深度。這種標注是通過將二維圖像平面上的邊界框向后投影到三維長方體來實現(xiàn)的。它允許系統(tǒng)區(qū)分三維空間中的體積和位置等特征。

優(yōu)點和缺點:

解決了物體方向的問題。

當物體被遮擋,這種標注可以想象包圍框的維度,這可能會影響訓(xùn)練。

這種標注也會包括背景像素,可能會影響訓(xùn)練。

多邊形

有時,必須標記形狀不規(guī)則的物體。在這種情況下,使用多邊形。注釋時只需標記物體的邊緣,我們就能得到要檢測的物體的完美輪廓。

優(yōu)點和缺點:

多邊形標記的主要優(yōu)點是它消除了背景像素,并捕獲了物體的精確尺寸。

非常耗時,如果物體的形狀是復(fù)雜的,很難標注。

注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。

數(shù)據(jù)采集是ML冷啟動的問題。但是,即使你有了一個可行的數(shù)據(jù)集,構(gòu)建和測試模型也是需要技巧的。

2) 線/邊緣檢測(線和樣條)

在劃分邊界時,線和樣條是有用的。將區(qū)分一個區(qū)域和另一個區(qū)域的像素進行標注。

優(yōu)點和缺點:

這種方法的優(yōu)點是,連線上的像素不需要都是連續(xù)的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。

手動標注圖像中的線是非常累人和費時的,特別是圖像中有很多的線的時候。

當物體碰巧是對齊的時候,可能會給出誤導(dǎo)的結(jié)果。

3) 姿態(tài)預(yù)測 / 關(guān)鍵點識別

在許多計算機視覺應(yīng)用中,神經(jīng)網(wǎng)絡(luò)常常需要識別輸入圖像中重要的感興趣的點。我們把這些點稱為地標或關(guān)鍵點。在這種應(yīng)用中,我們希望神經(jīng)網(wǎng)絡(luò)輸出關(guān)鍵點的坐標(x, y)。

4) 分割

圖像分割是將一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。圖像分割方法有很多種。

語義分割: 語義分割是一項機器學習任務(wù),它需要像素級標注,其中圖像中的每個像素都被分配給一個類。每個像素都帶有語義意義。這主要用于環(huán)境背景非常重要的情況。

實例分割: 實例分割是圖像分割的一種子類型,它在像素級別上標識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級別之一。

全景分割: 全景分割結(jié)合了語義分割和實例分割,所有像素都被分配一個類標簽,所有目標實例都被唯一地分割。

5) 圖像分類

圖像分類不同于目標檢測。目標檢測的目的是識別和定位目標,而圖像分類的目的是識別和識別特定的目標類。這個用例的一個常見示例是對貓和狗的圖片進行分類。標注者必須為一只狗的圖像分配一個類標簽“dog”,對貓的圖像分配類標簽“cat”。

圖像標注的用例

在本節(jié)中,我們將討論如何使用圖像標注來幫助機器模型執(zhí)行特定行業(yè)的任務(wù):

零售:2D邊框可以用于標注產(chǎn)品的圖像,然后機器學習算法可以使用這些圖像來預(yù)測成本和其他屬性。圖像分類在這方面也有幫助。

醫(yī)學:多邊形可用于在醫(yī)用x射線中標記器官,以便將它們輸入深度學習模型,以訓(xùn)練x射線中的畸形或缺陷。這是圖像標注最重要的應(yīng)用之一,需要醫(yī)學專家具有較高的領(lǐng)域知識。

自動駕駛汽車:這是另一個重要的領(lǐng)域,圖像標注可以應(yīng)用。利用語義分割對圖像中的每個像素進行標記,使車輛能夠感知到道路上的障礙物。這一領(lǐng)域的研究仍在進行中。

情緒檢測:這是里程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應(yīng)用于評估受試者對特定內(nèi)容的情緒反應(yīng)。

制造行業(yè):線和樣條可用于標注工廠的圖像線跟隨機器人工作。這可以幫助自動化生產(chǎn)過程,人力勞動可以最小化。

圖像標注的一些挑戰(zhàn)

時間復(fù)雜度:手工標注圖像需要很多時間,機器學習需要大量的數(shù)據(jù)集,需要大量的時間來有效地標注這些基于圖像的數(shù)據(jù)集。

計算復(fù)雜度:機器學習需要精確標注的數(shù)據(jù)來運行模型。如果標注者在給圖像做標注的時候,注入任何一種錯誤,都可能會影響到訓(xùn)練,所有的努力都可能付諸東流。

領(lǐng)域知識:如前所述,圖像標注通常需要特定領(lǐng)域的高級領(lǐng)域知識。因此,我們需要知道該標注什么的注解者,以及該領(lǐng)域的專家。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1089

    瀏覽量

    40575
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47683

    瀏覽量

    240336
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1461

    瀏覽量

    34168

原文標題:圖像標注的基礎(chǔ)內(nèi)容介紹

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI自動圖像標注工具SpeedDP將是數(shù)據(jù)標注行業(yè)發(fā)展的重要引擎

    利用AI模型訓(xùn)練打造的深度學習算法開發(fā)平臺SpeedDP,就可以替代人工進行海量的圖像數(shù)據(jù)標注。相比于人工,SpeedDP具有多個優(yōu)勢。更快熟練的人工標注一張簡單
    的頭像 發(fā)表于 01-02 17:53 ?231次閱讀
    AI自動<b class='flag-5'>圖像</b><b class='flag-5'>標注</b>工具SpeedDP將是數(shù)據(jù)<b class='flag-5'>標注</b>行業(yè)發(fā)展的重要引擎

    標貝數(shù)據(jù)標注在智能駕駛訓(xùn)練中的落地案例

    標貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點云標注以及3D&2D融合等標注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標注、障
    的頭像 發(fā)表于 12-24 15:17 ?597次閱讀
    標貝數(shù)據(jù)<b class='flag-5'>標注</b>在智能駕駛訓(xùn)練中的落地案例

    淺析基于自動駕駛的4D-bev標注技術(shù)

    4D-bev標注技術(shù)是指在3D空間中以時間作為第四個維度進行標注的過程。4D-bev通常在地場景較為復(fù)雜的自動駕駛場景中使用,其可以通過精準地跟蹤和記錄動態(tài)對象的運動軌跡、姿勢變化
    的頭像 發(fā)表于 12-06 15:01 ?1461次閱讀
    淺析基于自動駕駛的4D-bev<b class='flag-5'>標注</b>技術(shù)

    常見散熱材料的優(yōu)缺點以及應(yīng)用場景

    常見的散熱材料包括導(dǎo)熱硅脂、導(dǎo)熱墊片、相變導(dǎo)熱材料、導(dǎo)熱膠、導(dǎo)熱灌封膠、導(dǎo)熱膠帶和導(dǎo)熱石墨片等。以下是這些材料的定義、優(yōu)缺點以及應(yīng)用場景的概述: 1.導(dǎo)熱硅脂 導(dǎo)熱硅脂也稱為散熱硅脂或?qū)岣啵怨栌?/div>
    的頭像 發(fā)表于 12-03 09:44 ?831次閱讀

    標貝科技:自動駕駛中的數(shù)據(jù)標注類別分享

    的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù)已成為支撐自動駕駛熱潮必不可少的一環(huán)。本文將以數(shù)據(jù)標注的視角,通過標貝科技自研平臺標貝數(shù)據(jù)標注平臺,展示自動駕駛常見的幾種標注
    的頭像 發(fā)表于 11-22 14:58 ?1171次閱讀
    標貝科技:自動駕駛中的數(shù)據(jù)<b class='flag-5'>標注</b>類別分享

    工具型AI標注平臺SpeedDP工作流程是怎樣的?

    SpeedDP作為一個工具型AI平臺,它能提供從數(shù)據(jù)標注、模型訓(xùn)練、測試驗證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。平臺所需算法并不是固定的,使用者可以根據(jù)自身實際應(yīng)用場景進行
    的頭像 發(fā)表于 11-19 01:02 ?459次閱讀
    工具型AI<b class='flag-5'>標注</b>平臺SpeedDP工作流程是怎樣的?

    開環(huán)和閉環(huán)功放的區(qū)別,優(yōu)缺點,應(yīng)用場合有什么不同?

    問下TI的工程師,開環(huán)和閉環(huán)功放的區(qū)別,優(yōu)缺點,應(yīng)用場合有什么不同?請解釋下,謝謝!
    發(fā)表于 11-04 06:33

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)按鈕標注場景

    對于用戶可點擊等操作的任何按鈕,如果不是文本類控件,則須通過給出標注信息,包括用戶自定義的控件中的虛擬按鈕區(qū)域,否則可能會導(dǎo)致屏幕朗讀用戶無法完成對應(yīng)的功能。 此類控件在進行標注時,標注文本不要包含
    發(fā)表于 10-10 16:48

    SpeedDP! 超便利AI自動圖像標注工具 功能豐富、省時省力

    超級AI,在線標注,既能解放雙手,又省時省力。傳統(tǒng)的標注模式需要你對著目標不斷拉框,反復(fù)機械的動作做多了就變得“麻木”,影響效率還使人煩惱。而SpeedDP的出現(xiàn),可以有效的提升標注效率。它能夠幫助
    的頭像 發(fā)表于 08-30 12:59 ?353次閱讀
    SpeedDP! 超便利AI自動<b class='flag-5'>圖像</b><b class='flag-5'>標注</b>工具   功能豐富、省時省力

    繼電保護器的種類及其優(yōu)缺點

    繼電保護器在電力系統(tǒng)中扮演著至關(guān)重要的角色,它們負責監(jiān)測電力系統(tǒng)中的電氣參數(shù)和信號,并在系統(tǒng)發(fā)生故障或異常情況時迅速切斷電路,以保護電氣設(shè)備和人員的安全。根據(jù)不同的分類標準,繼電保護器可以分為多種類型,每種類型都有其獨特的優(yōu)缺點
    的頭像 發(fā)表于 08-09 09:44 ?1194次閱讀

    神經(jīng)網(wǎng)絡(luò)模型的原理、類型、應(yīng)用場景優(yōu)缺點

    模型的原理、類型、應(yīng)用場景以及優(yōu)缺點。 神經(jīng)網(wǎng)絡(luò)模型的原理 神經(jīng)網(wǎng)絡(luò)模型的基本原理是模擬人腦神經(jīng)元的工作方式。人腦由大約860億個神經(jīng)元組成,每個神經(jīng)元通過突觸與其他神經(jīng)元相互連接。神經(jīng)元接收來自其他神經(jīng)元的信
    的頭像 發(fā)表于 07-02 09:56 ?1772次閱讀

    各種電機的類型、優(yōu)缺點及應(yīng)用

    電機作為現(xiàn)代工業(yè)和科技領(lǐng)域的核心動力裝置,其種類繁多,各具特色,廣泛應(yīng)用于各個領(lǐng)域。本文將對幾種常見的電機類型進行詳細介紹,包括其優(yōu)缺點以及主要應(yīng)用領(lǐng)域,以便讀者能夠更好地了解和選擇適合自己的電機。
    的頭像 發(fā)表于 06-04 16:52 ?3805次閱讀

    標貝數(shù)據(jù)采集標注在自動駕駛場景中落地應(yīng)用實例

    AI數(shù)據(jù)服務(wù)作為人工智能和機器學習的基礎(chǔ),在自動駕駛領(lǐng)域中有著重要地位。與其他人工智能應(yīng)用場景相比,自動駕駛的落地場景相對復(fù)雜,想要讓汽車本身的算法做到處理更多、更復(fù)雜的場景,就需要運用大量
    的頭像 發(fā)表于 05-28 14:22 ?719次閱讀
    標貝數(shù)據(jù)采集<b class='flag-5'>標注</b>在自動駕駛<b class='flag-5'>場景</b>中落地應(yīng)用實例

    慧視SpeedDP大模型打造圖像標注新時代

    在人工智能時代,圖像標注不僅能夠反哺AI的發(fā)展,還能進一步降低項目成本。傳統(tǒng)的圖像標注需要人工采用文本或者相應(yīng)工具機械式的進行圖像標簽分配,
    的頭像 發(fā)表于 05-24 08:29 ?629次閱讀
    慧視SpeedDP大模型打造<b class='flag-5'>圖像</b><b class='flag-5'>標注</b>新時代

    人工圖像標注1~2分鐘,SpeedDP僅需7-8毫秒!降本增效不是夢!

    在工作中你有沒有遇到這樣的問題,20萬拿下一個項目,時間緊迫,但是項目有著大量的圖像標注需求,如果單獨招一個圖像標注的工程師,光該崗位的工資成本就會花去四五萬,畢竟項目結(jié)束了你總不能就
    的頭像 發(fā)表于 03-29 08:28 ?665次閱讀
    人工<b class='flag-5'>圖像</b><b class='flag-5'>標注</b>1~2分鐘,SpeedDP僅需7-8毫秒!降本增效不是夢!
    百家乐官网赌场在线娱乐| 太阳城小区| 百家乐打连技巧| 在线百家乐官网博彩| 网上百家乐官网如何作假| 延吉市| 郧西县| 锡林郭勒盟| 龙游县| 长岛县| 百家乐官网注册开户送现金| 百家乐官网路单用处| 平邑县| 沙龙百家乐官网怎申请| 波音百家乐官网游戏| 乐九百家乐官网现金网| 百家乐官网相对策略| 曲周县| 百家乐官网视频游戏金币| 百家乐官网网址皇冠现金网| 网络百家乐官网破解平台| 百家乐官网美国玩法| 百家乐官网羸钱法| 蓝盾百家乐官网赌城| 汇丰百家乐官网娱乐城| 繁体子24画的有| 网络百家乐的陷阱| 百家乐任你博娱乐场| 中国百家乐的玩法技巧和规则 | 施甸县| 陈巴尔虎旗| 网络百家乐官网破解平台| 威斯汀百家乐官网的玩法技巧和规则 | 24山向什么最好| 百家乐最好投注| 中华百家乐的玩法技巧和规则| 东方太阳城二期| bet365手机客户端| 巴彦淖尔市| 金鼎百家乐官网局部算牌法| 中原百家乐官网的玩法技巧和规则 |