吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Ground-truth數據面臨哪些挑戰?

佐思汽車研究 ? 來源:lp ? 2019-03-12 16:03 ? 次閱讀

Ground-truth(真值)是什么?

Ground-truth在機器學習中表示有監督學習的訓練集的分類準確性,用于證明或者推翻某個假設。有監督的機器學習會對訓練數據打標記,將那些正確打標記的數據成為ground truth。Ground truth就是參考標準,一般用來做誤差量化,最終用于驗證分類算法的準確性。真值標定的輸入一般是視頻文件。真值標定既可以手動一幀一幀地標定,也可以半自動化標定后再手工修正,最終可以將結果保存成真值數據庫。

Ground-truth在自動駕駛汽車產業具有很高的的附加值,它涉及以下數據處理流程:數據采集、數據標注、模型訓練、應用、驗證。擁有最高質量Ground-truth數據的公司將會處于自動駕駛汽車的最前沿。

Ground-truth質量影響算法質量。

一、Ground-truth數據面臨哪些挑戰

丟失或模糊的對象

不一致的標記(行人手中有物體或沒有物體)

不同種類車輛之間不明確的邊界

系統性的標記誤差

不精確性

定義不佳的需求

1.1 丟失或模糊的對象

1.2 不一致的標記 (行人手中有物體或沒有物體)

1.3 不同種類車輛之間不明確的邊界

1.4 系統化標記誤差

原始的標記框不精確,通過對頂部和底部的修正以及更詳細的注釋使得標記框更加精確。

二、實驗:Ground Truth質量對于算法性能的影響

2.1 實驗

我們展示了標記框實驗的初步結果

1. 復合分類(定義不佳的標簽需求)

2. 不精確的真值標記

復合分類

圖中騎車人和行人被標記了出來,自行車沒有被標記出來。

2.2 復合Caltech:新數據集

行人與攜帶行李的行人的對比

Caltech完成了從原始不精確標記框到更為精確的標記框,再到高質量復合型標記框的轉變。

2.3 復合型Caltech訓練

1. 用于重復性結果的框外物體檢測

2. 體系結構:更快的 rcnn_resnet101_coco (coco預訓練)

3. Caltech數據庫微調(任何一個變量都有一個獨立的模型,沒有超參數調優)

2.4 Caltech檢測器評估

Caltech 改進的Caltech 復合Caltech
mAP@0.5 0.2170 0.3030 0.2916

初步結果:復合Caltech降低了精確度

2.5 扭曲VOC邊界框

2.6實驗總結

標記不精確(質量)對高精度區域的性能影響顯著。

三、解決方案

加速標注過程:更高速、精確并且具有成本效益

人工標注過程從90分鐘壓縮到35分鐘

可視化不確定的地方,引導標記人員

四、Understand.ai 質量保證辦法

一是依靠智能算法

深度學習推理,與不確定性計算共同加快標注員的工作

算法質量檢測與物體追蹤

二是依靠人類智慧

每一幅圖像都經過人類標注員的驗證

通過內部專家提供額外的質量保證

通過智能算法與人類智慧,共同完成高質量的標注。

通過算法推薦,計算不確定的地方,以及標記人員解決不確定性的地方,共同完成高質量的標注。

LIDAR標注

通過算法和工具,使得速度最高能提高5倍。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3846

    瀏覽量

    64686
  • 機器學習
    +關注

    關注

    66

    文章

    8439

    瀏覽量

    133087
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167010

原文標題:Ground-truth質量是算法質量的關鍵

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    移動電視射頻技術面臨什么挑戰

    隨著數字移動電視不斷向移動設備的應用轉移,應用和系統工程師正面臨著各種挑戰,比如外形尺寸的小型化、更低的功耗以及信號完整性。對現有移動電視標準的研究重點將放在了DVB-H上。本文將從系統角度討論DVB-H接收器設計所面臨的機遇和
    發表于 06-03 06:28

    患者監護儀設計面臨挑戰有哪些?

    遠程患者監護系統面臨的五大設計挑戰:電池壽命便攜性或尺寸患者安全安全的數據傳輸集成
    發表于 11-23 06:43

    精確測量阻抗所面臨挑戰有哪些

    精確測量阻抗所面臨挑戰
    發表于 01-27 07:34

    調試速度高達幾個Gb每秒的連接時所面臨挑戰

    本文將討論信號集成和硬件工程師在設計或調試速度高達幾個Gb每秒的連接時所面臨挑戰。無論是進行下一代高分辨率視頻顯示、醫學成像、數據存儲或是在最新的高速以太網和電信協議中,我們都面臨
    發表于 03-01 10:17

    部署實時數據流平臺面臨挑戰有哪些?

    部署實時數據流平臺面臨的五大挑戰
    發表于 03-17 07:00

    為什么采用WCSP?WCSP面臨挑戰有哪些?

    為什么采用WCSP?WCSP面臨挑戰有哪些?
    發表于 04-21 06:14

    使用空中鼠標系統面臨哪些挑戰?如何去克服這些挑戰?

    使用空中鼠標系統面臨哪些挑戰?如何去克服這些挑戰?
    發表于 05-10 07:26

    有什么方法可以解決HID設計面臨挑戰?

    HID設計面臨哪些挑戰?有什么方法可以解決HID設計面臨挑戰?
    發表于 05-17 06:06

    汽車無線安全應用面臨哪些設計挑戰

    汽車無線安全應用面臨哪些設計挑戰?
    發表于 05-19 06:41

    無線基礎設施容量面臨挑戰是什么?

    無線基礎設施容量面臨挑戰是什么?
    發表于 05-20 06:47

    高速通信面臨挑戰是什么?

    高速通信面臨挑戰是什么?
    發表于 05-24 06:34

    RFID原理是什么?RFID技術面臨哪些挑戰?

    RFID原理是什么?RFID技術面臨哪些挑戰
    發表于 05-26 06:06

    HUD 2.0面臨哪些挑戰?如何去解決?

    HUD 2.0的發展動力是什么?HUD 2.0面臨哪些挑戰?如何去解決?
    發表于 06-01 06:44

    機器開發人員面臨哪些軟件挑戰以及硬件挑戰?如何去應對這些挑戰?

    機器開發人員面臨哪些軟件挑戰以及硬件挑戰?如何去應對這些挑戰?
    發表于 06-26 07:27

    如何在不增加額外參數量的前提下把模型的表達能力挖掘到極致

    Knowledge distillation 只使用了單獨的 soft label,而不是 DeiT 里面 hard 形式的 label 加 one-hot ground-truth,因為研究者認為 soft label 包含的信息更多,更有利于知識蒸餾;
    的頭像 發表于 08-08 16:25 ?1228次閱讀
    波克棋牌游戏大厅下载| 十三张娱乐城开户| 豪门百家乐官网的玩法技巧和规则| 大发888 备用6222.co| 百家乐最新赌王| 保险百家乐官网怎么玩| 998棋牌游戏| 公海百家乐的玩法技巧和规则| 蓝盾百家乐官网代理打| 黔江区| 最好百家乐的玩法技巧和规则| 百家乐官网导航| 网上百家乐官网博彩正网| 大西洋城娱乐| 太阳城娱乐网可信吗| 百家乐波音平台导航网| 嘉禾百家乐官网的玩法技巧和规则| 吉安市| 大发888注册送28| 杰克百家乐玩法| 真人百家乐现金游戏| 电子百家乐官网假在线哪| 澳门百家乐官网限红规则| 百家乐官网游戏合法吗| E胜博| 在线百家乐博彩网| 做生意挂什么画招财| 百家乐官网任你博赌场娱乐网规则| 百家乐官网桌子北京| 百家乐官网免費游戏| 英伦国际| bet365虚拟运动| 大发888 方管下载| 大发888平台啥时候最赢钱| 二爷百家乐的玩法技巧和规则 | 百家乐官网好多假网站| 云龙县| 百家乐游戏开户网址| 哪家百家乐从哪而来| 百家乐制胜绝招| 百家乐娱乐平台会员注册|