吉祥棋牌电脑版下载,KK娱乐场官网注册送彩金,博彩网公司(中国)·官方网站

本文介紹的論文提出了一種新的實時通用語義分割體系結(jié)構(gòu)RGPNet，在復(fù)雜環(huán)境下取得了顯著的性能提升。
作者： Tom Hardy
首發(fā)：3D視覺工坊微信公眾號

論文：RGPNet: A Real-Time General Purpose Semantic Segmentation （文末可下載）
論文鏈接：https://arxiv.org/abs/1912.01394

一、主要思想

本文提出了一種新的實時通用語義分割體系結(jié)構(gòu)RGPNet，在復(fù)雜環(huán)境下取得了顯著的性能提升。RGPNet由一個輕量級的非對稱編碼器-解碼器和一個適配器組成。適配器有助于從編碼器和解碼器之間的多層分布式表示中保留和細化抽象概念。它也有助于從較深層到較淺層的梯度流動。大量實驗表明，與目前最先進的語義分割網(wǎng)絡(luò)相比，RGPNet具有更好的性能。

此外還證明了在保持性能的同時，使用改進的標簽松弛技術(shù)和逐步調(diào)整大小可以減少60%的訓(xùn)練時間。論文還對應(yīng)用在資源受限的嵌入式設(shè)備上的RGPNet進行了優(yōu)化，使推理速度提高了400%，性能損失可以忽略不計。RGPNet在多個數(shù)據(jù)集之間獲得了更好的速度和精度權(quán)衡。

二、創(chuàng)新點

1、提出的RGPNet作為一種通用的實時語義分割體系結(jié)構(gòu)，它可以在單分支網(wǎng)絡(luò)中獲得高分辨率的深層特征，從而提高準確性和降低延遲，在復(fù)雜的環(huán)境中具有競爭力。

2、引入一個適配器模塊來捕獲多個抽象級別，以幫助細分的邊界細化，適配器還通過添加較短的路徑來輔助漸變梯度流。

3、對于green AI，在訓(xùn)練期間采用漸進式調(diào)整大小技術(shù)，從而使訓(xùn)練時間和環(huán)境影響減少60%，并且采用一種改進的標簽松弛來消除低分辨率標簽映射中的混疊效應(yīng)。

4、使用TensorRT（一個高性能深度學(xué)習(xí)推理平臺）優(yōu)化RGPNet，以便部署在邊緣計算設(shè)備上，從而使推理速度提高400%。

5、RGPNet在Cityscpes、CamVid和Mapillary數(shù)據(jù)集上分別實現(xiàn)了Resnet-101作為backbone 下80.9%、69.2%和50.2% mIoU以及Resnet-18作為backbone下74.1%、66.9%和41.7% mIoU。對于1024×2048分辨率的圖像，RGPNet在CityScapes數(shù)據(jù)集上單NVIDIA GTX2080Ti GPU下達到37.4 FPS。

三、網(wǎng)絡(luò)結(jié)構(gòu)

RGPNet的整體結(jié)構(gòu)如下所示，每個箭頭都有對應(yīng)的操作模式：

中間一列操作為編碼器
最右邊操作為解碼器
“+”操作為適配器（Adaptor）

其中“+”詳細操作如下所示：
1、T（：）是一個轉(zhuǎn)換函數(shù)，它用來減少編碼器模塊輸出通道數(shù)量并將其傳輸?shù)絘daptor。
2、D（：）和U（：）是下采樣和上采樣功能。

Adaptor有許多優(yōu)點：

1、Adaptor聚合來自不同上下文和空間級別的特征。
2、通過引入較短的路徑，有助于梯度從較深的層流向較淺的層。
3、Adaptor允許使用輕量解碼器的不對稱設(shè)計，這將減少卷積層，進一步增強梯度流。因此，Adaptor使網(wǎng)絡(luò)適合于實時應(yīng)用，因為它在保留空間信息的同時提供了豐富的語義信息。

針對帶標簽松弛的漸進式調(diào)整：

論文采取了最大化像素周圍區(qū)域相似度分布，而不是單個像素級別的標簽最大可能化，針對邊界類別，提出了邊界損失函數(shù)。

四、實驗結(jié)果

多種網(wǎng)絡(luò)在Mapillary Vistas數(shù)據(jù)集上的測試結(jié)果：

幾種網(wǎng)絡(luò)在Mapillary Vistas數(shù)據(jù)集上的性能對比：

在CamVid數(shù)據(jù)集上的性能對比：

RGPNet使用TensorRT在GTX2080Ti和Xavier上速度對比：

綜合速度和準確率以及實際部署下的性能，RGPNet都非常具有競爭力~!

推薦閱讀

3D U-Net：從稀疏注釋中學(xué)習(xí)密集的體積分割
超全的3D視覺數(shù)據(jù)集匯總

重點介紹：1、3D視覺算法；2、vslam算法;3、圖像處理；4、深度學(xué)習(xí);5、自動駕駛;6、技術(shù)干貨。博主及合伙人分別來國內(nèi)自知名大廠、海康研究院，深研3D視覺、深度學(xué)習(xí)、圖像處理、自動駕駛、目標檢測、VSLAM算法等領(lǐng)域。
歡迎關(guān)注微信公眾號

審核編輯：符乾江

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1796

文章
47666

瀏覽量
240270
計算機視覺

計算機視覺

+關(guān)注

關(guān)注
8

文章
1700

瀏覽量
46125

SparseViT：以非語義為中心、參數(shù)高效的稀疏化視覺Transformer

（IML）都遵循“語義分割主干網(wǎng)絡(luò)”與“精心制作的手工制作非語義特征提取”相結(jié)合的設(shè)計，這種方法嚴重限制了模型在未知場景的偽影提取能力。論文標題： Can We Get Rid

發(fā)表于 01-15 09:30 ?116次閱讀

SparseViT：以非<b class='flag-5'>語義</b>為中心、參數(shù)高效的稀疏化視覺Transformer

利用VLM和MLLMs實現(xiàn)SLAM語義增強

語義同步定位與建圖（SLAM）系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境，特別是在復(fù)雜的室內(nèi)環(huán)境中。本文提出了一種面向?qū)ο骃LAM的語義增

發(fā)表于 12-05 10:00 ?275次閱讀

利用VLM和MLLMs實現(xiàn)SLAM<b class='flag-5'>語義</b>增強

復(fù)雜環(huán)境下多無人智能車輛協(xié)同調(diào)控

摘要：該文對多無人智能車以領(lǐng)航-跟隨法在復(fù)雜環(huán)境下運動的編隊控制問題進行了探討，通過采用閉環(huán)控制律設(shè)計了一種編隊控制器和編隊控制方案，該編隊控制器的優(yōu)點在于其主要考慮智能車之間的距離和角度，同時

發(fā)表于 11-16 10:12 ?533次閱讀

<b class='flag-5'>復(fù)雜</b><b class='flag-5'>環(huán)境</b><b class='flag-5'>下</b>多無人智能車輛協(xié)同調(diào)控

使用語義線索增強局部特征匹配

視覺匹配是關(guān)鍵計算機視覺任務(wù)中的關(guān)鍵步驟，包括攝像機定位、圖像配準和運動結(jié)構(gòu)。目前最有效的匹配關(guān)鍵點的技術(shù)包括使用經(jīng)過學(xué)習(xí)的稀疏或密集匹配器，這需要成對的圖像。這些神經(jīng)網(wǎng)絡(luò)對兩幅圖像的特征有很好的總體理解，但它們經(jīng)常難以匹配不同語義區(qū)域的點。

發(fā)表于 10-28 09:57 ?335次閱讀

語義分割25種損失函數(shù)綜述和展望

語義圖像分割，即將圖像中的每個像素分類到特定的類別中，是許多視覺理解系統(tǒng)中的重要組成部分。作為評估統(tǒng)計模型性能的主要標準，損失函數(shù)對于塑造基于深度學(xué)習(xí)的分割算法的發(fā)

發(fā)表于 10-22 08:04 ?793次閱讀

<b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

手冊上新 |迅為RK3568開發(fā)板NPU例程測試

測試 6.1 deeplabv3語義分割 6.2 lite_transformer 6.3 LPRNet車牌識別 6.4 mobilenet圖像分類 6.5 PPOCR-Rec文字識別 6.6

發(fā)表于 08-12 11:03

復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計方案

是能夠模擬真實戰(zhàn)場或特定測試場景下的復(fù)雜電磁環(huán)境，包括各種通信信號、雷達信號、干擾信號、噪聲等，以評估電子設(shè)備的性能和穩(wěn)定性。智慧華盛恒輝系統(tǒng)組成 1. 信號生成單元功能：根據(jù)預(yù)設(shè)或實時

發(fā)表于 07-17 17:06 ?516次閱讀

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務(wù)，它旨在將圖像中的每個像素分配到相應(yīng)的語義類別中。這項技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用，如自動駕駛、醫(yī)學(xué)圖像分析、機器人導(dǎo)航等。一、圖像語義

發(fā)表于 07-17 09:56 ?522次閱讀

圖像分割和語義分割的區(qū)別與聯(lián)系

圖像分割和語義分割是計算機視覺領(lǐng)域中兩個重要的概念，它們在圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像分割簡介圖像分割是將圖像劃分為多個區(qū)

發(fā)表于 07-17 09:55 ?1161次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領(lǐng)域的重要任務(wù)，旨在將圖像劃分為多個具有特定語義含義的區(qū)域或?qū)ο蟆＞矸e神經(jīng)網(wǎng)絡(luò)（CNN）作為深度學(xué)習(xí)的一種核心

發(fā)表于 07-09 11:51 ?1156次閱讀

工業(yè)級路由器：讓你輕松應(yīng)對復(fù)雜網(wǎng)絡(luò)環(huán)境！

工業(yè)級路由器助力應(yīng)對復(fù)雜網(wǎng)絡(luò)環(huán)境。具備高穩(wěn)定性、高帶寬、強抗干擾能力，適用于工廠、礦區(qū)、機場等惡劣環(huán)境。選擇可靠品牌和關(guān)注售后服務(wù)是關(guān)鍵，提高網(wǎng)絡(luò)

發(fā)表于 05-06 11:58 ?268次閱讀

STM32F107VCT6+DP83848在復(fù)雜網(wǎng)絡(luò)環(huán)境中網(wǎng)絡(luò)部分掛掉的原因？怎么解決？

幾個小時后，就有6個控制板會網(wǎng)絡(luò)不通，有4個還是通的。有時開一天都正常。現(xiàn)在懷疑是因網(wǎng)絡(luò)環(huán)境復(fù)雜之后，有時有大量的廣播數(shù)據(jù)包導(dǎo)致單片機網(wǎng)絡(luò)

發(fā)表于 04-11 07:24

fpga通用語言是什么

FPGA（現(xiàn)場可編程門陣列）的通用語言主要是指用于描述FPGA內(nèi)部邏輯結(jié)構(gòu)和行為的硬件描述語言。目前，Verilog HDL和VHDL是兩種最為廣泛使用的FPGA編程語言。

發(fā)表于 03-15 14:36 ?554次閱讀

復(fù)雜環(huán)境下，車載中控系統(tǒng)如何助力指揮車高效運作

在復(fù)雜多變的環(huán)境中，訊維車載中控系統(tǒng)通過其先進的技術(shù)和強大的功能，為指揮車的高效運作提供了重要支持。以下是幾個方面的表現(xiàn)：一、強大的信息感知與處理能力在復(fù)雜環(huán)境

發(fā)表于 03-06 16:15 ?400次閱讀

助力移動機器人下游任務(wù)！Mobile-Seed用于聯(lián)合語義分割和邊界檢測

精確、快速地劃定清晰的邊界和魯棒的語義對于許多下游機器人任務(wù)至關(guān)重要，例如機器人抓取和操作、實時語義建圖以及在邊緣計算單元上執(zhí)行的在線傳感器校準。

發(fā)表于 02-20 10:30 ?995次閱讀

吴忠躺衫网络科技有限公司

搜索歷史

RGPNET：復(fù)雜環(huán)境下實時通用語義分割網(wǎng)絡(luò)

一、主要思想

二、創(chuàng)新點

三、網(wǎng)絡(luò)結(jié)構(gòu)

四、實驗結(jié)果

評論

SparseViT：以非語義為中心、參數(shù)高效的稀疏化視覺Transformer

利用VLM和MLLMs實現(xiàn)SLAM語義增強

復(fù)雜環(huán)境下多無人智能車輛協(xié)同調(diào)控

使用語義線索增強局部特征匹配

語義分割25種損失函數(shù)綜述和展望

手冊上新 |迅為RK3568開發(fā)板NPU例程測試

復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計方案

圖像語義分割的實用性是什么

圖像分割和語義分割的區(qū)別與聯(lián)系

圖像分割與語義分割中的CNN模型綜述

工業(yè)級路由器：讓你輕松應(yīng)對復(fù)雜網(wǎng)絡(luò)環(huán)境！

STM32F107VCT6+DP83848在復(fù)雜網(wǎng)絡(luò)環(huán)境中網(wǎng)絡(luò)部分掛掉的原因？怎么解決？

fpga通用語言是什么

復(fù)雜環(huán)境下，車載中控系統(tǒng)如何助力指揮車高效運作

助力移動機器人下游任務(wù)！Mobile-Seed用于聯(lián)合語義分割和邊界檢測