吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

NVIDIA英偉達 ? 來源:未知 ? 2023-07-26 19:30 ? 次閱讀

音頻可以包含從人類語言到非語言聲音等各種聲音,例如狗吠和警笛聲。在為聽力困難的人設計無障礙應用程序時,該應用程序應能夠識別聲音并理解語義。

這種技術將有助于聾啞或聽力有障礙的人可視化語音,例如人類的對話和非語音聲音。通過將語音和聲音 AI 相結合,可以將這些可視化效果疊加到 AR 眼鏡上,從而使用戶能夠看到并理解他們無法聽到的聲音。

根據世界衛生組織的統計,約有 15 億人(占全球人口近 20%)患有聽力損失。到 2050 年,這一數字將上升至 25 億。

Cochl 是 NVIDIA 的合作伙伴,總部位于圣何塞。該公司是一家利用聲音 AI 技術來理解各類音頻的科技密集型初創企業。他同時也是 NVIDIA 初創加速計劃的會員。通過提供尖端技術和 NVIDIA 專家的支持,該計劃幫助初創企業更快地構建解決方案。

該平臺可識別 37 種環境聲音,并且 CochI 還加入了先進的語音轉文本技術,使用戶能夠真正全方位地了解聲音世界。

AR 眼鏡可視化任何聲音

AR 眼鏡作為一個可視化聲音的工具,有望極大改善聽力損失者的生活。這項技術可以幫助提高他們的交流能力,使他們更容易理解和融入到周圍的世界。

Cochl.Sense 和 NVIDIA Riva 在微軟 HoloLens 2 上運行!

在此方案中,自動語音識別(ASR)使眼鏡能夠識別并理解人類的語音。這項技術可通過多種方式集成到眼鏡中:

  • 使用麥克風捕捉與聾啞人或聽力有障礙者交談的人的語音,然后使用 ASR 算法解釋語音并將其轉錄為文本,最后將該文本顯示在眼鏡上,從而使聾啞人或聽力有障礙者能夠閱讀并理解該語音。

  • ASR 還可以使眼鏡能夠響應語音命令,以便用戶可以通過語音控制眼鏡。

  • AR 眼鏡還能在屏幕上顯示所有對話(例如在駕車時轉錄地圖上的語音指示)以及其他聲音(例如緊急車輛的喇叭聲、警報聲以及風聲)。

解決方案背后的技術

Cochl 在其軟件堆棧中使用了 NVIDIA Riva 來增強其 ASR 功能。Riva 是一個使用 GPU 加速、完全可定制的 SDK,用于開發語音 AI 的應用程序。通過使用 Riva,該平臺的功能得以擴展,能夠理解包括非語音聲音在內的各種聲音。

Cochl 聯合創始人兼首席執行官 Yoonchang Han 表示:“我們測試了很多語音識別服務,但只有 Riva 提供了極高且穩定的實時性能。所以現在我們可以讓我們的聲音 AI 系統更加接近人類的聽覺感知。”

“正如我們所觀察到的,AR 眼鏡最有可能在環境嘈雜的開放空間中使用。NVIDIA Riva 幫助我們在嘈雜的環境中也能準確轉錄語音,并為我們提供了無縫體驗,可以集成到我們的 Cochl.Sense 平臺上。”

輔助技術的未來

創建一個能像人類一樣感知聲音的通用 AI 系統是一項巨大的挑戰。為了使 AR 眼鏡更易于使用,需要更輕便的可穿戴技術。

盡管它們仍然是將聲音和語音轉化為視覺信息的理想媒介。通過集成機器聽覺功能,AR 眼鏡能夠為世界各地的聾啞或聽力障礙者帶來更加安全、便捷和愉快的日常生活體驗。

Cochl 還在探索語音 AI 的更多用例,例如為 AR 眼鏡上的任何視頻提供隱藏式字幕和實現多個發言者的轉錄。為了給聽力障礙者帶來最佳體驗,該公司正在探索分析并可視化音樂的方法,以幫助他們至少能夠理解音樂的類型和情感。

該公司期待體驗更多的 NVIDIA 解決方案,包括 Riva、NVIDIA NeMo 和 NVIDIA TensorRT。

點擊“閱讀原文”,或掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創始人兼 CEO 黃仁勛在 SIGGRAPH 現場發表的 NVIDIA 主題演講,了解 NVIDIA 的新技術,包括屢獲殊榮的研究,OpenUSD 開發,以及最新的 AI 內容創作解決方案。


原文標題:聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3848

    瀏覽量

    91978

原文標題:聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    七款經久不衰的數據可視化工具!

    。通過FineBI,企業能夠多維度、多場景下進行靈活的數據分析,提升數據可視化效果,幫助決策者做出更加精準的決策。
    發表于 01-19 15:24

    光學系統的3D可視化

    **摘要 ** 為了從根本上了解光學系統的特性,對其組件進行可視化并顯示光的傳播情況大有幫助。為此,VirtualLab Fusion 提供了顯示光學系統三維可視化的工具。這些工具還可用于檢查元件
    發表于 01-06 08:53

    解鎖個性語音交互新時代:九芯智能語音云平臺,讓創意聲音觸手可及!

    九芯智能語音云平臺提供全面高效安全的智能語音服務,支持自定義語音內容,簡化燒錄流程,依托AI技術,助力各行業智能升級,引領
    的頭像 發表于 01-02 16:51 ?182次閱讀
    解鎖個性<b class='flag-5'>化</b><b class='flag-5'>語音</b>交互新時代:九芯智能<b class='flag-5'>語音</b>云平臺,讓創意<b class='flag-5'>聲音</b>觸手可及!

    什么是大屏數據可視化?特點有哪些?

    大屏數據可視化是指通過大屏幕展示大量數據和信息,以直觀、可視化的方式幫助用戶理解和分析數據。這種展示方式通常用于展示復雜的數據集、實時監控系統、企業管理儀表盤等。以下是關于 大屏數據可視化 的詳細
    的頭像 發表于 12-16 16:59 ?286次閱讀

    智慧能源可視化監管平臺——助力可視化能源數據管理

    博達可視化大屏設計平臺智慧能源領域的價值體現在實時監控、數據可視化、決策支持和效率提升等方面。借助該平臺,企業可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產和生活,實現能
    的頭像 發表于 11-29 10:00 ?457次閱讀
    智慧能源<b class='flag-5'>可視化</b>監管平臺——助力<b class='flag-5'>可視化</b>能源數據管理

    智慧樓宇可視化的優點

    智慧樓宇可視化是指通過數據可視化技術來展示和分析樓宇的各種數據,為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化的優點,詳細介紹其樓宇管理和運營中的重要作用
    的頭像 發表于 11-19 14:25 ?236次閱讀

    大屏數據可視化 開源

    在當今信息爆炸的時代,數據已經成為各個行業決策制定和業務發展的關鍵。為了更直觀、準確地理解和利用海量數據, 大屏數據可視化 成為一種強大的工具。通過將數據以圖表、圖形等形式展示大屏幕,不僅
    的頭像 發表于 06-27 16:06 ?466次閱讀
    大屏數據<b class='flag-5'>可視化</b> 開源

    如何實現園區大屏可視化

    孿生可視化 構建平臺利用Web三維可視化技術對現實場景進行仿真,實現園區級業務場景 的可視化呈現,助力企業快速完成項目的實施。實現園區場景立體可先,極致可視。那么,今天古河云科技就來給
    的頭像 發表于 06-19 15:39 ?492次閱讀
    如何實現園區大屏<b class='flag-5'>可視化</b>?

    態勢數據可視化技術有哪些

    智慧華盛恒輝態勢數據可視化技術是一種將數據以圖形、圖像、動畫等視覺形式展現出來的技術,特別是處理和分析態勢數據時,該技術能夠將復雜的數據轉化為直觀、易于理解的視覺表現。以下是態勢數據可視化技術
    的頭像 發表于 06-11 15:47 ?416次閱讀

    大屏數據可視化的作用和意義

    大屏數據可視化是指利用大屏幕設備展示數據信息,通過圖表、圖像、動畫等視覺手段將數據呈現出來,以便用戶能夠直觀、清晰地理解數據背后的含義和關聯。信息化時代,數據已經成為企業決策和運營的重要依托,而
    的頭像 發表于 06-03 17:56 ?773次閱讀

    三維可視化數據大屏的設計原理和技巧

    三維可視化數據大屏設計面向交通、園區、城市、建筑、應急等領域的客戶,以孿生可視能力賦能,提供行業解決方案。雙渲染引擎,1:1還原真實世界,模型運行流暢的基礎提供極佳的視覺效果。今天
    的頭像 發表于 05-30 17:09 ?605次閱讀

    FUXA基于Web的過程可視化軟件案例

    FUXA——基于Web的過程可視化軟件
    發表于 04-24 18:32 ?3次下載

    態勢數據可視化技術有哪些

    智慧華盛恒輝態勢數據可視化技術是一種將復雜、動態的態勢數據以直觀、易于理解的方式展現出來的技術手段。以下是幾種主要的態勢數據可視化技術: 網絡安全態勢指標可視化分析系統及方法,針對安全態勢指標不準
    的頭像 發表于 04-22 15:17 ?467次閱讀

    物聯網可視化監控大屏如何實現?有什么功能?

    物聯網飛速發展的時代,可視化監控大屏成為了眾多企業和機構實現智能管理和監控的重要工具。它將各種各樣設備的運行狀態和數據以圖形、圖表、動畫等形式展示大屏或其他移動設備
    的頭像 發表于 04-11 09:25 ?984次閱讀

    OPPO發布全新AR眼鏡Air Glass 3,集成AI語音助手功能

    OPPO于近日MWC 2024震撼發布了其最新增實境(AR眼鏡原型——OPPO Air Glass 3。這款新型眼鏡不僅在設計和技術上
    的頭像 發表于 03-04 14:00 ?1066次閱讀
    明升备用网站| 百家乐视频计牌器| 新大发888pt老虎机| 真人百家乐官网国际第一品牌| 太阳城洋伞| 百家乐官网群b28博你| 大发888官网充值| 百家乐单注技巧| e世博线上娱乐| 红9百家乐官网的玩法技巧和规则 高尔夫百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城会员注册| 百家乐官网打法介绍| 莆田棋牌游戏下载| 百家乐胜率被控制| 长城百家乐官网游戏| 百家乐透视牌靴哪里有| 百家乐官网概率怎么算| 天猫百家乐娱乐城| 百家乐官网的玩法技巧和规则 | 百合百家乐官网的玩法技巧和规则 | 百家乐投资心得| 百家乐官网平台开发| 缅甸百家乐的玩法技巧和规则 | 大发888开户大发娱乐权威吗| 西游记百家乐官网娱乐城| 贵港市| 实战百家乐十大取胜原因百分百战胜百家乐不买币不吹牛只你能做到按我说的.百家乐基本规则 | 网上现金游戏| 网上百家乐娱乐网| e世博百家乐官网攻略| 六合彩图纸| 百家乐双面数字筹码怎么出千| 百家乐官网玩揽法的论坛| 网上足球投注| 高尔夫百家乐的玩法技巧和规则| 十三张百家乐官网的玩法技巧和规则| 湖口县| 水果机破解器| 百家乐折桌子| 百家乐官网槛| 淮北市|