案例介紹
騰訊云音視頻 PaaS 平臺與 NVIDIA 團隊合作,利用CV-CUDA加速視頻增強 AI 工作管線中的前后處理模塊,結合NVIDIA TensorRT,將視頻增強 AI 全流程置于 GPU 上進行加速,前后處理部分效率提升 16% - 38%。客戶簡介
騰訊云音視頻 PaaS 平臺(以下簡稱騰訊視頻云)專注技術產品,構建了行業中極速高清智能轉碼、超低時延快直播的音視頻解決方案,已連續四年居于市場份額和解決方案首位[1],在音視頻領域已有超過 21 年的技術積累,騰訊云音視頻已持續支持國內 90% 的音視頻客戶。其中騰訊云 MPS 媒體處理服務為海內外客戶提供全場景極速高清轉碼,音視頻增強,專有云 codec SDK 等服務,在近期全球 MSU 云端編碼大賽及 SLC 評測中,所參評項目均取得了第一名的好成績[2]。
使用 GPU 加速視頻增強 AI 全流程
本案例中,騰訊云音視頻 PaaS 平臺與 NVIDIA 團隊合作,利用CV-CUDA加速視頻增強 AI 工作管線中的前后處理模塊,結合NVIDIA TensorRT,將視頻增強 AI 全流程置于 GPU 上進行加速。集成 CV-CUDA 后相比加速前,前后處理部分效率提升 16% - 38%,端到端效率提升 6% - 10%。
加速畫質增強全鏈路工作管線的挑戰
畫質增強是騰訊視頻云提供的主要視頻類云服務之一,其通過 3D 去噪、色彩增強、超分辨率、插幀等處理技術,有效處理噪點、馬賽克、抖動、頓挫感等問題,提高畫面清晰度,讓畫質重生。該服務的工作管線基于 ffmpeg filter 構建,整體工作流如下圖所示:
圖 1. 畫質增強工作管線示意圖
該服務中應用了三種主要的 AI 模型,包括:去噪模型、色彩增強模型以及超分辨率模型。這些模型的工作管線中,除模型推理外,還包含了一系列前后處理操作,包括:yuv2rgb、copyMakeBorder、normalize、hwc2chw、chw2hwc、float2uint8、rgb2yuv 等。
此前,這些前后處理操作使用自定義的 CUDA 算子在 GPU 上處理或使用 OpenCV 在 CPU 上處理,計算效率并不理想。一方面,這使得前后處理在整個工作管線中占據了可觀的開銷;另一方面,前后處理可能增加 CPU 負載,影響 CPU 上其他任務的執行效率。因此,如何盡可能地節省前后處理引入的開銷,緩解 CPU 負載,成為了加速畫質增強全鏈路工作管線的挑戰。
視頻增強 AI 前后處理效率提升 16% - 38%
騰訊視頻云與 NVIDIA 合作,將 CV-CUDA 集成進去噪模型、色彩增強模型和超分辨率模型的工作流中,替換原有的 CUDA 算子及 OpenCV CPU 算子,從而加速前后處理部分的計算效率,提升 AI 任務端到端的推理效率。下表展示了對于 1080p 輸入圖像,應用 CV-CUDA 前后,上述三種模型工作管線的處理速度(單位:ms):
![5ba6e562-2d25-11ee-815d-dac502259ad0.png](https://file1.elecfans.com//web2/M00/A0/93/wKgaomToNvSAMk4LAAAZethQc_w118.png)
圖 2. 使用 CV-CUDA 后,處理
1080p輸入圖像的效率提升效果
可以觀察到,使用 CV-CUDA 后,三種模型的前后處理部分的計算效率有了不同程度的加速,模型整體性能也得以提升。此種性能提升尤其在前后處理耗時占比大的任務中將更加明顯。
持續合作,實現視頻 AI 全鏈路 GPU 加速
騰訊視頻云未來將持續與 NVIDIA 合作,對提升視頻增強服務處理效率方面進行不斷地探索。例如,雙方將共同嘗試引入 TensorRT 最新的特性,進一步加速視頻增強各類模型的推理性能;另外,雙方將繼續推動利用 CV-CUDA 加速更多視頻類工作管線的處理,實現視頻 AI 全鏈路 GPU 加速。
準備好開始了嗎?
CV-CUDA 搶先體驗開發者申請:
https://developer.nvidia.cn/zh-cn/cv-cuda/early-access
[1] 資料來源于騰訊云音訊頻開發者社區官網,其數據來源于國際數據公司(IDC)發布的《中國視頻云市場跟蹤(2021 上半年) 》https://cloud.tencent.com/developer/article/2046119。 [2] 資料來源于騰訊云音訊頻開發者社區官網,據莫斯科國立大學(MoscowState University)于 2021 年與 2022 年舉辦的 MSU 云端視頻轉碼大賽(CloudVideo Transcoding Services Comparison)成績公布https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612 。
點擊“閱讀原文”,或掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創始人兼 CEO 黃仁勛在 SIGGRAPH 現場發表的 NVIDIA 主題演講,了解 NVIDIA 的新技術,包括屢獲殊榮的研究,OpenUSD 開發,以及最新的 AI 內容創作解決方案。
原文標題:CV-CUDA 助力騰訊云音視頻 PaaS 平臺實現視頻增強 AI 全流程 GPU 加速
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3847瀏覽量
91970
原文標題:CV-CUDA 助力騰訊云音視頻 PaaS 平臺實現視頻增強 AI 全流程 GPU 加速
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
艾為電子助力閃極科技發布音視頻AI眼鏡
![艾為電子<b class='flag-5'>助力</b>閃極科技發布<b class='flag-5'>音視頻</b><b class='flag-5'>AI</b>眼鏡](https://file1.elecfans.com/web3/M00/04/EC/wKgZPGd7RVyAB1XIAAA2IjssHHI342.png)
AMS-HE200:HDMI音視頻網絡延長器,開啟傳輸新時代
![AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網絡延長器,開啟傳輸新時代](https://file1.elecfans.com/web1/M00/F3/9F/wKgZoWcaAH6AaljYAALGiDPOZgk881.png)
盤點那些常見音視頻接口
常見音視頻接口的靜電浪涌防護和濾波方案
音視頻IP化浪潮全面來襲,分布式系統開創音視頻行業新時代!
高清HDMI轉USB 3.0音視頻多功能音采集卡-測評
![高清HDMI轉USB 3.0<b class='flag-5'>音視頻</b>多功能音采集卡-測評](https://file1.elecfans.com/web2/M00/E5/75/wKgZomZDMlqALsmmAAKKlWwPPbI342.png)
【RTC程序設計:實時音視頻權威指南】音視頻的編解碼壓縮技術
音視頻SoC與AI技術融合,帶來更智能的音視頻處理解決方案
【RTC程序設計:實時音視頻權威指南】音頻采集與預處理
【RTC程序設計:實時音視頻權威指南】新書一瞥
音視頻解碼生成:打造極致觀影體驗的關鍵技術
音視頻解碼器硬件加速:實現更流暢的播放效果
![<b class='flag-5'>音視頻</b>解碼器硬件<b class='flag-5'>加速</b>:<b class='flag-5'>實現</b>更流暢的播放效果](https://file1.elecfans.com/web2/M00/C1/39/wKgaomXUUOaACuUKAAGt-k1tox4555.jpg)
評論