吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種新型分割圖像中人物的方法,基于人物動作辨認

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-04-10 15:02 ? 次閱讀

想要進行圖像分割,傳統方法是先檢測圖中物體,在進行分離。在本文中,來自清華大學、騰訊AI研究室和英國卡迪夫大學的研究者們提出了一種新型分割圖像中人物的方法,基于人物動作辨認。以下是論智對原文的編譯。

圖像分割的一般方法是先對物體進行檢測,然后用邊界框對畫中物體進行分割。最近,例如Mask R-CNN的深度學習方法也被用于圖像分割任務,但是大多數研究都沒有注意到人類的特殊性:可以通過身體姿勢進行辨認。在這篇論文中,我們提出了一種新方法,可以通過人作出的不同動作進行圖像分割。

多人姿態辨認的目的是分辨圖像中每個人物的動作,這些需要通過身體部位判斷,比如頭部、肩膀、手部、腳等等。而一般的對象分割實例旨在預測圖像中每個對象的像素級標簽。要想解決這兩個問題,都需要檢測目標物體并將它們分離,這一過程通常被稱為目標檢測。但是由于二維圖像所含信息較少,導致想分離兩個重疊的同類圖像非常困難。對于目標檢測,有許多強有力的基準系統,例如Fast/Faster R-CNN、YOLO,它們都遵循著一個基本規則:先生成大量proposal regions,然后用非極大抑制刪除重復區域。但是,當兩個相同類別的物體重疊時,NMS總是將其中一個視為重復的proposal region,然后刪除它。這表明幾乎所有的目標檢測都不能處理大面積重合的問題。

盡管在許多多人姿態識別任務中都選用了這種框架,一些不依賴于目標檢測的bottom-up方法也取得了良好性能。Bottom-up方法的主要思想是首先在所有人身體上找幾個關鍵點。如圖1所示:

圖1

這種方法有幾個優點,首先,運行成本不會隨著圖像中人數的增加而增加;其次,兩個重疊在一起的人物可以在連接身體部位時分開,如圖2所示,使用人體姿勢可以改善目標檢測中物體重疊的問題。

圖2

新方法Pose2Seg

基于人體姿勢識別,我們提出了一種端到端的物體分割框架,整體框架如圖3所示,它將圖片和姿勢識別結果一同作為輸入:

圖3

然后我們使用一個對準模塊,基于人體姿勢檢測結果(稱為Affine Align),將感興趣區域(ROI)對齊為統一大小(64×64)。同時,我們為圖中的每個人物生成骨架特征,并將它們連接到ROI。最終實驗表明,將骨骼信息明確地添加到網絡中可以在圖像分割中提供更好的信息。

AffineAlign

人類的動作種類多且復雜,想要進行圖像分割是很困難的。基于Faster R-CNN和Mask R-CNN中的ROIAlign,我們提出了AffineAlign操作。但是與它們不同的是,我們是基于人物的動作對齊,而不是邊界框。通過人類動作蘊涵的信息,AffineAlign操作可以把奇怪的人類動作拉直,然后將重疊的人分開,具體過程可看圖4:

圖4

同時,我們還研究了人類骨骼的特征,我們用部分親和字段(PAF)重現某個動作的骨骼結構,PAF是一個有兩通道的向量字段映射,如果COCO數據集中有11個骨骼標記,PAF就是一個有22個通道的特征映射。

實驗過程

我們選用了COCO數據集,它是人類圖像數量最多的公開數據及,其中我們將其分成了COCOHUMAN和COCOHUMAN-OC兩個數據集,前者是有中等和大型目標物體的人類數據集,并對其中的動作進行了標注;后者是有較多重疊對象的圖像,共有44張圖。COCOHUMAN-OC中的一些樣例如圖所示:

首先是在COCOHUMAN上,本文提出的方法與Mask R-CNN進行對比:

其他AffineAlign操作,a代表輸入的圖像,b代表在原圖上鎖定目標,c代表AffineAlign操作的結果,d代表分割結果

然后是在COCOHUMAN-OC上的實驗對比:

我們的方法與Mask R-CNN在處理重疊圖像上的表現。我們方法中的邊界框使用預測掩碼生成的,能更好地進行可視化和對比

上表顯示,我們提出的基于動作姿勢的框架比基于圖像檢測的框架表現得好。由于非極大抑制,一些基于檢測的框架,如Mask R-CNN無法處理大面積重疊的現象。即使目標物體能被分離,仍然有一部分無法算入其中。但是在這種新框架下,我們做到了讓整個身體都被分離的結果。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18046
  • 深度學習
    +關注

    關注

    73

    文章

    5513

    瀏覽量

    121546

原文標題:清華大學與騰訊AI合作推出Pose2Seg:無需目標檢測即對人像進行分割

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種新的粘連字符圖像分割方法

    一種新的粘連字符圖像分割方法針對監控畫面采樣圖像中數字的自動識別問題,提出一種新的粘連字符
    發表于 09-19 09:19

    基于改進遺傳算法的圖像分割方法

    基于改進遺傳算法的圖像分割方法提出一種應用于圖像分割的改進遺傳算法,算法中引入了優生算子、改進的
    發表于 09-19 09:36

    人物

    人物看似大人物的心,卻走不出小人物的路。
    發表于 05-28 15:07

    Unity 3D和Vuforia制作AR人物互動

    還沒開始談的時候就已經通過某種渠道獲得了人物模型和動畫,花了差不多4天時間從零開始完成了AR識別到人物展示以及人物動作這幾個過程,而經過
    發表于 09-21 10:30

    分享一種CameraCube新型圖像傳感技術

    分享一種CameraCube新型圖像傳感技術
    發表于 06-08 09:29

    一種名片圖像的文字區塊分割方法

    針對以手機攝像頭作為圖像采集器獲得的名片圖像,該文介紹一種文字區塊的分割方法。對用手機攝像頭獲取的彩色名片
    發表于 04-15 09:00 ?24次下載

    一種改進的圖像分割算法分析

    針對傳統閾值分割算法的些缺點,通過將數字形態學與閾值分割算法相互結合提出了一種改進的閾值分割算法來進行脊椎
    發表于 11-03 09:47 ?3次下載
    <b class='flag-5'>一種</b>改進的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法分析

    一種新的彩色圖像分割算法

    本文提出一種新的結合分水嶺與種子區域生成、區域合并的彩色圖像分割算法。首先將RGB顏色空間轉換成HSI間,應用分水嶺算法對圖像進行初始化分割
    發表于 12-14 14:41 ?1次下載
    <b class='flag-5'>一種</b>新的彩色<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法

    圖像分割的基本方法解析

    本文詳細介紹了圖像分割的基本方法有:基于邊緣的圖像分割方法、閾值
    發表于 12-20 11:06 ?11w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于內容的圖像分割方法綜述

    方法、基于像素聚類的方法和語義分割方法這3類型并分別加以介紹對每類方法所包含的典型算法,尤其
    發表于 01-02 16:52 ?2次下載
    基于內容的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>綜述

    一種視頻流特定人物檢測方法

    為實現視頻流特定人物檢測,提出了一種兩階段檢測方法,即基于穩健哈希簽名的流級檢測和基于子圖局部特征的文件級檢測。第階段利用簽名快速發現與查詢圖像
    發表于 03-05 16:38 ?1次下載

    基于視頻深度學習的時空雙流人物動作識別模型

    深度學習被運用于圖片分類、人物臉部識別和人物位置預測等識別領域。視頻人物動作識別可看作隨時間變化圖片的分類問題,所以圖片識別的深度學習方法
    發表于 04-17 10:46 ?0次下載
    基于視頻深度學習的時空雙流<b class='flag-5'>人物</b><b class='flag-5'>動作</b>識別模型

    一種開源的機器學習模型,可在瀏覽器中使用TensorFlow.js對人物及身體部位進行分割

    人物分割有何用途?這項技術可廣泛應用于多個多領域,包括增強現實、攝影編輯以及圖像或視頻的藝術效果等。具體應用由您決定!去年,當我們推出 PoseNet(首個能夠在瀏覽器中使用簡易網絡攝像頭估測身體
    的頭像 發表于 02-26 16:33 ?5881次閱讀

    基于TensorFlow的開源JS庫的網頁前端人物動作捕捉的實現

    。開發者可以根據項目需求,對獲得到的人體各keypoint數據進行分析處理,實現程序功能。*在基本的原理中并不是必須的組成部分,但在下文中會簡單介紹一種通過的圖像繪制功能,提升人物捕捉精度的
    的頭像 發表于 08-13 20:07 ?1493次閱讀
    基于TensorFlow的開源JS庫的網頁前端<b class='flag-5'>人物</b><b class='flag-5'>動作</b>捕捉的實現

    一種可用于生成動漫人物頭像的改進模型

    針對已有的動漫人物頭像生成方法中生成結果的多樣性較差,且難以準確地按照用戶想法按類生成或按局部細節生成的問題,基于含輔助分類器的對抗生成網絡( ACGAN),結合互信息理論、多尺度判別等提出了一種
    發表于 04-20 11:19 ?3次下載
    <b class='flag-5'>一種</b>可用于生成動漫<b class='flag-5'>人物</b>頭像的改進模型
    太阳城百家乐168| 真人棋牌游戏| 真人百家乐蓝盾娱乐平台| 黄金百家乐官网的玩法技巧和规则| 皇冠网hg8333.com| 大发888 赌场娱乐网规则 | 什么是百家乐平注法| 百家乐官网真人投注网站| 戰神国际娱乐城| 云鼎娱乐城优惠| 顶级赌场| 幸运水果机下载| 黄金城百家乐手机版| 百家乐程序开户发| 百家乐偷码| 百家乐百胜注码法| 七胜百家乐娱乐网| 赌百家乐澳门| 百家乐英皇娱乐城| 百家乐推广| 百家乐注册开户送彩金| 百家乐官网认牌| 百家乐官网最新产品| 百家乐官网澳门百家乐官网澳门赌场| 百家乐官网是哪个国家| 澳门百家乐官网游戏说明| AG百家乐官网大转轮| 戒掉百家乐官网的玩法技巧和规则 | 大发888娱乐城shouye| 威尼斯人娱乐城 老品牌值得您信赖| 百家乐如何捕捉长龙| 百家乐庄闲出现几| 帝王百家乐新足球平台| 高科技百家乐牌具| 富田太阳城二期| 大发888下载客户端| 大发888 备用6222.com| 御金娱乐城| 至尊百家乐官网qvod| 百家乐官网最佳打| 百家乐游戏群号|