吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

未來的人臉識別數據庫中應減少面部表情偏差

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-29 09:40 ? 次閱讀

面部識別系統存在問題的原因有很多,其中最重要的一點是它們往往對某些人口群體和性別表現出偏見。近日,麻省理工學院研究人員還進行了一項新研究,即研究AI對某些面部表情的偏見。研究人員稱,表情對面部識別系統的影響“至少”與戴圍巾、帽子、假發或眼鏡有影響一樣,而且面部識別系統在這方面是用高度偏差的數據集訓練的。

這項研究增加了越來越多的證據表明面部識別容易受到有害的、普遍存在的偏見的影響。研究人員去年秋天發表的一篇論文顯示,亞馬遜、微軟等公司人工智能對順性別男性和女性的準確率都在95%以上,但有38%的情況下,將跨性別男性誤認為女性。“性別色彩項目”和美國國家標準與技術研究所(NIST)對主要供應商系統的獨立基準測試表明,面部識別技術表現出種族和性別偏見,同時表明目前的面部識別程序可能非常不準確,有時錯誤分類率高達96%。

在他們的研究過程中,合作作者使用三種不同的領先的人臉識別模型進行了實驗,這些模型在包括VGGFace2(一個包含超過9100人的300萬張圖片的數據庫)和MS1M-ArcFace(擁有超過85000人的580萬張圖片)的開源數據庫上進行了訓練。他們將它們與四種語料庫進行對比,具體規模如下:

● 這種復雜的面部表情包含了230個人在實驗室控制的環境下拍攝的照片。

● 擴展的Cohn-Kanade(CK+),一個最廣泛使用的用于訓練和評估面部表情識別系統的數據庫,包含123個人的593張照片序列

● CelebA是一個大規模的人臉屬性數據集,包含10000位名人的20萬張圖片。

● 微軟于2016年發布的一項面向公眾的人臉識別基準和數據集MS-Celeb-1M,該數據集包含了100萬名名人的近1000萬張圖片。

正如研究人員指出的那樣,長期以來,學術界和企業一直從網絡、電影和社交媒體等來源上搜集面部照片,以解決模型訓練數據稀缺的問題。像大多數機器學習模型一樣,面部識別模型需要大量的數據才能達到基本的精確度水平。但事實證明,這些數據來源通常是不平衡的,因為一些面部表情比其他表情更不常見。例如,人們傾向于在社交網絡上分享更多快樂的臉,而不是悲傷的臉。

為了通過表情對四種基準語料庫中的圖像進行分類,研究人員使用了來自Affectiva的軟件,該軟件可以識別多達7種面部表情:6種基本情緒和中性表情。他們發現,在所有數據集中,“中性”圖像的比例超過了60%,在微軟MS-Celeb-1M名人圖片庫中達到83.7%。第二常見的面部表情是“快樂”,在所有的數據集中,大約90%的圖像顯示的是一個“中立”或“快樂”的人。至于其他5種面部表情,“驚訝”和“厭惡”的比例很少超過6%,而“悲傷”、“恐懼”和“憤怒”的比例非常低(通常低于1%)。結果也因性別而異。在VGGFace2中,“快樂”女性的數量幾乎是“快樂”男性數量的兩倍。

研究人員在一篇描述他們工作的論文中寫道:“一方面,模型是使用高偏差的數據進行訓練的,這些數據會導致異構性能。另一方面,人們只會對主流表情進行評估,隱藏了其對某些特定面部表情圖像的真實表現。此外,性別偏見也很重要,因為它可能會導致男女雙方的表現不同。”

接下來,研究人員進行了一項分析,以確定像CelebA這樣的示例集中的面部表情偏差對面部識別系統預測的影響程度。在上述三種算法中,在顯示“中性”或“高興”表情的人臉上,性能更好,這也是訓練數據庫中最常見的表情。這項研究的結果表明,面部表情的差異并不能誘使系統誤認為一個人是另一個人。然而,他們也暗示,面部表情偏差會導致系統的“真實”比較分數(衡量算法區分同一張臉圖像的能力的分數)之間的差異高達40%。

研究人員只使用了某個軟件來對情緒進行分類,這可能會在他們的實驗中引入無意識的偏見,而且他們沒有測試任何商業部署的系統,比如亞馬遜的Rekognition、谷歌Cloud的Vision API或微軟Azure的Face API。盡管如此,他們主張在未來的人臉識別數據庫中減少面部表情偏差,并進一步開發適用于現有數據庫和已經在問題數據集上訓練過的模型的偏差減少方法。

研究人員表示:用于開發和評估人臉識別系統的人臉數據庫缺乏面部表情的多樣性,這一缺點之一是會導致系統存在安全漏洞,面部表情的微小變化很容易誤導圍繞這些有偏見的數據庫開發的人臉識別系統。面部表情對人臉識別系統計算出的匹配分數有影響。這種影響可能會被利用為一個可能的漏洞,從而降低匹配的概率。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    76

    文章

    4015

    瀏覽量

    82314
  • 面部識別
    +關注

    關注

    1

    文章

    375

    瀏覽量

    26710
收藏 人收藏

    評論

    相關推薦

    數據庫是哪種數據庫類型?

    數據庫是一種部署在虛擬計算環境數據庫,它融合了云計算的彈性和可擴展性,為用戶提供高效、靈活的數據庫服務。云數據庫主要分為兩大類:關系型
    的頭像 發表于 01-07 10:22 ?138次閱讀

    ElfBoard開源項目|百度智能云平臺的人臉識別項目

    百度智能云平臺的人臉識別項目,旨在利用其強大的人臉識別服務實現自動人臉識別。選擇百度智能云的原因
    的頭像 發表于 12-24 10:54 ?646次閱讀
    ElfBoard開源項目|百度智能云平臺<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b>項目

    數據庫數據恢復—Mysql數據庫表記錄丟失的數據恢復流程

    Mysql數據庫故障: Mysql數據庫表記錄丟失。 Mysql數據庫故障表現: 1、Mysql數據庫無任何
    的頭像 發表于 12-16 11:05 ?223次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—Mysql<b class='flag-5'>數據庫</b>表記錄丟失的<b class='flag-5'>數據</b>恢復流程

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    一個運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一個NDF文件,每個NDF幾百GB大小。數據庫包含兩個LDF文件。 存儲損壞,數據庫
    的頭像 發表于 10-31 13:21 ?336次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

    SQL Server數據庫故障: SQL Server附加數據庫出現錯誤823,附加數據庫失敗。數據庫沒有備份,無法通過備份恢復數據庫
    的頭像 發表于 09-20 11:46 ?409次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>出現823錯誤的<b class='flag-5'>數據</b>恢復案例

    隧道人臉識別門禁系統應用于隧道工程等場所的智能化安全管理系統

    控制器 接收人臉識別設備傳來的信息,對人員身份進行驗證。 控制門禁的開啟和關閉,確保只有授權人員能夠進入隧道。 3、數據庫 存儲人員的面部特征數據
    的頭像 發表于 09-04 16:38 ?503次閱讀
    隧道<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>門禁系統應用于隧道工程等場所的智能化安全管理系統

    自研創新 數智未來 2024數據庫技術大會盛大召開

    浪潮洶涌澎湃,數據庫作為信息技術的核心基礎設施,正以前所未用的速度推動各行各業的智能化升級。大會以“自研創新 數智未來”為主題,設置2大主會場,20+技術專場,重點圍繞向量數據庫與向量檢索技術實踐、
    的頭像 發表于 08-27 18:07 ?675次閱讀
    自研創新 數智<b class='flag-5'>未來</b> 2024<b class='flag-5'>中</b>國<b class='flag-5'>數據庫</b>技術大會盛大召開

    基于FPGA的人臉識別技術

    基于FPGA(現場可編程邏輯門陣列)的人臉識別技術,是一種結合了高效并行處理能力和靈活可編程性的先進圖像處理解決方案。這種技術在安全監控、身份認證、人機交互等領域具有廣泛應用前景。以下將詳細介紹基于FPGA的人臉
    的頭像 發表于 07-17 11:42 ?1582次閱讀

    基于OpenCV的人臉識別系統設計

    基于OpenCV的人臉識別系統是一個復雜但功能強大的系統,廣泛應用于安全監控、人機交互、智能家居等多個領域。下面將詳細介紹基于OpenCV的人臉識別系統的基本原理、實現步驟,并附上具體
    的頭像 發表于 07-11 15:37 ?1.5w次閱讀

    數據庫數據恢復—SQL Server數據庫所在分區空間不足報錯的數據恢復案例

    SQL Server數據庫數據恢復環境: 某品牌服務器存儲中有兩組raid5磁盤陣列。操作系統層面跑著SQL Server數據庫,SQL Server數據庫存放在D盤分區
    的頭像 發表于 07-10 13:54 ?578次閱讀

    如何挑選理想的人臉識別考勤系統產品?人臉識別設備的選型

    如何挑選理想的人臉識別考勤系統產品?在挑選理想的人臉識別考勤系統產品時,需要綜合考慮多個方面,包括但不限于設備的性能、兼容性、數據存儲能力、
    的頭像 發表于 06-05 14:59 ?543次閱讀
    如何挑選理想<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b>考勤系統產品?<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>設備的選型

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server數據庫,存儲空間在操作系統層面劃分了三個邏輯分區
    的頭像 發表于 05-08 11:43 ?578次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    時序數據庫是什么?時序數據庫的特點

    時序數據庫是一種在處理時間序列數據方面具有高效和專門化能力的數據庫。它主要用于存儲和處理時間序列數據,比如傳感器數據、監控
    的頭像 發表于 04-26 16:02 ?705次閱讀

    ?通過Modbus讀寫數據庫數據

    本文是將數據庫數據轉為Modbus服務端/從站,實現數據庫內的數據也可以走Modbus協議通過網口或串口讀寫的案例,下圖是通過智能網關的參數軟件(在附件
    發表于 03-14 13:44

    車內語音識別數據在智能駕駛的價值與應用

    和個性化提供了有力支持。本文將詳細介紹車內語音識別數據在智能駕駛的價值、應用以及面臨的挑戰和未來的發展趨勢。 二、車內語音識別數據的價值 提高駕駛安全性:通過語音控制車輛功能,駕駛員
    的頭像 發表于 02-19 11:47 ?668次閱讀
    百家乐桌现货| 澳门百家乐官网娱乐平台| 最新百家乐官网游戏机| 金昌市| 皇冠投注平台| 阳东县| 打百家乐官网的技术| 澳门百家乐官网娱乐城开户| 网上百家乐官网哪家最好| 百家乐官网娱乐城备用网址| 打百家乐官网纯打庄的方法| 旧金山百家乐官网的玩法技巧和规则| 二爷百家乐官网的玩法技巧和规则| 百家乐官网官方网站| 澳门百家乐娱乐城开户| 百家乐娱乐平台开户| 大发888官方我的爱好| 澳博娱乐| 百家乐官网资金注码| 百家乐官网白菜价| 百家乐官网推荐| 百家乐破解| 大西洋百家乐的玩法技巧和规则 | 大发888娱乐城论坛| 3D乐财网| 百家乐官网百家乐官网论坛| 实战百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城代理加盟| 德州扑克玩法| 网上百家乐官网投注技巧| 真百家乐官网游戏| 线上百家乐可靠吗| 威尼斯人娱乐城首存优惠| 现金斗地主| 百家乐官网打法心得| 百家乐发牌铲| 百家乐桌子黑色| 百家乐赌博| 网络百家乐官网公式打法| 百家乐全讯网娱乐城| 大发888娱乐场下载专区|