吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

說話人識別和驗證系統解決方案

陳敏 ? 來源:rstech_rd ? 作者:rstech_rd ? 2022-07-26 10:16 ? 次閱讀

說話人識別和驗證系統的應用與日俱增。該技術的使用有助于控制和訪問自動駕駛汽車、計算機、手機和其他設備。還建立了各種機器學習模型來保護說話人識別和驗證系統。這是通過分析聲音的情緒反應和壓力水平來檢測對個人的威脅以及觸發他們安全的機制來實現的。

介紹

說話者和驗證系統根據一個人的聲音或講話的特性來識別說話者。人類每天都習慣于識別和響應說話者,但通過技術進行語音識別是復雜的,需要大量計算。由于數字信號處理和計算機系統的進步,自動說話人識別系統的使用在過去十年中變得普遍。

說話人識別系統的組成部分

說話人識別系統包括三個部分:

說話人識別:從一組登記的說話人中查明說話人的身份。目標是從已存儲的幾個模型中找到合適的揚聲器。(檢查多人)

說話人驗證:驗證未知聲音是否屬于某個說話人。當一個人將自己標識為 John Doe/Jane Doe 時,說話人驗證系統會將語音數據與錄制的模型進行比較,以確定說話人的身份是否與他/她聲稱的身份相符。(檢查聲稱的身份)

說話者分類:根據語音的特殊特征(基于從語音內容中提取的特征)將包含說話者語音的音頻流劃分為同質段/時間幀,以對說話者進行身份分類。

說話人驗證系統的應用

訪問控制一個人必須說出一個特定的短語來表明自己的身份,才能訪問受限場所和特權信息

交易認證:一個人必須說出一個特定的短語來識別他/她自己,以啟動電話銀行/信用卡授權或類似的交易。

揚聲器驗證系統基礎知識

pYYBAGLeEjaAJgDiAAAx2mLo8qQ833.jpg

圖 1:揚聲器驗證基礎

Front-End 部分捕獲說話者的聲音,并將語音信號轉換為一組代表說話者特征的特征向量。后端部分將特征向量與說話者的存儲模型(即通用背景模型,如下所述)進行比較,以確定它們匹配的精確程度以驗證說話者的身份。一旦說話者的聲音與數據庫中的聲音模型匹配,他們就可以訪問。

用于記錄和創建“揚聲器模型”的機制的變化增加了復雜性。由于可變的語音/語音保真度,說話人識別/驗證變得更加復雜。例如,在銀行使用高分辨率、高保真錄音機創建揚聲器模型時,語音保真度會有所不同,但基于語音的交易是使用具有嘈雜背景的手機完成的。

說話人識別/驗證流程圖

最初創建了一個大型模型數據庫,其中包含許多說話者和來自這些說話者的數小時語音數據。錄音包含來自不同來源的各種高保真和低保真語音輸入。分析從大量語音數據中提取的特征并訓練模型以創建通用的男性/女性模型。該模型數據庫被稱為“通用背景模型”(UBM)。

然后,創建想要識別/驗證自己的說話者模型數據庫。該模型數據庫被稱為“揚聲器模型”。該模型是從“通用背景模型”派生/創建的,該模型對通用男性/女性聲音進行分類。目標揚聲器型號與 UBM 略有不同。這些差異被記錄并保存在“揚聲器模型”數據庫中。

現在,當這個人說:“我是 John Doe”時,這個語音片段被記錄下來并分割成 10 毫秒的幀,并通過特征提取模型,產生語音的一些特征/特征。

pYYBAGLeEkGAIYVdAAB9dl6J3JE265.jpg

圖 2:說話人驗證流程圖

如果 John Doe 想要驗證他的名字,我們將從輸入語音“I am John Doe”中提取的特征輸入到他的說話人模型(特征提取)中,該模型確定特征匹配的水平并計算它是“John多伊'。

然后,對于相同的輸入聲音,“我是 John Doe”,我們將提取的特征輸入到通用背景模型中,以確定特征匹配的水平,并得出他是普通男性聲音的可能性。

決策的似然比由上述兩個似然比得出。接受/拒絕決定是基于根據呼叫者是“John Doe”的可能性和呼叫者是普通男性的可能性(基于通用背景模型)計算的某個閾值做出的。

eInfochips 為基于語音和音頻的中間件提供嵌入式系統和軟件開發、移植、優化、支持和維護解決方案,其中包括:DSP 域中的編碼器、解碼器、預處理和后處理算法。還提供語音/音頻相關工具和服務的維護和開發。eInfochips 還迎合了多核平臺上自定義算法的實現和并行化。

作者:瑞詩凱詩·阿加什

Rhishikesh Agashe 是 eInfochips 技術團隊的一員,他在 IT 行業擁有近 19 年的經驗。4 年的企業家生涯和 15 年的嵌入式領域經驗,其中他的大部分經驗是在嵌入式媒體處理領域,他參與了音頻和語音算法的實施。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 識別系統
    +關注

    關注

    1

    文章

    138

    瀏覽量

    18850
收藏 人收藏

    評論

    相關推薦

    作為說話識別特征參量的MFCC的提取過程

    作為說話識別特征參量的MFCC的提取過程
    發表于 08-20 12:37

    DSP嵌入式說話識別系統設計方案

    信息安全等領域的應用逐漸增大,并成為人們日常生活和工作中重要且普及的安全驗證方式。目前,說話人身份識別在理論上和實驗室條件下已經達到了比較高的識別精度,并開始走向實際應用階段。AT&T
    發表于 07-29 06:34

    基于DSP嵌入式說話識別系統該怎么設計?

    說話人身份識別屬于生物認證技術的一種,是一項根據語音中反映說話人生理和行為特征的語音參數來自動識別說話人身份的技術。
    發表于 11-04 07:34

    說話識別算法研究及其在SOC上的實現

    說話識別算法研究及
    發表于 08-15 10:22 ?15次下載

    基于Cohort相似度的說話識別

    本文提出了一種基于Cohort 相似度度量的識別方式,訓練集外選擇出同這個目標說話比較近似的M 個說話計算M+1 維混合高斯,即Coho
    發表于 12-16 12:50 ?7次下載

    基于DTW的編碼域說話識別研究

    摘要! 相對解碼重建后的語音進行說話識別從VOIP的語音流中直接提取語音特征參數進行說話識別
    發表于 11-22 14:59 ?0次下載

    DSP嵌入式說話識別系統的設計與實現

    DSP嵌入式說話識別系統的設計與實現 0 引 言    說話人身份識別屬于生物認證技術的一種,是一項根據語
    發表于 12-28 17:55 ?669次閱讀
    DSP嵌入式<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別系統</b>的設計與實現

    DSP嵌入式說話識別系統的設計與實現

    DSP嵌入式說話識別系統的設計與實現  0 引 言   說話人身份識別屬于生物認證技術的一種,是一項根據語音中反映
    發表于 01-06 14:07 ?629次閱讀
    DSP嵌入式<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別系統</b>的設計與實現

    基于FPGA的說話識別系統設計

    基于FPGA的說話識別系統設計
    發表于 01-18 20:39 ?26次下載

    DSP嵌入式說話識別系統的設計方案

    等領域的應用逐漸增大,并成為人們日常生活和工作中重要且普及的安全驗證方式。目前,說話人身份識別在理論上和實驗室條件下已經達到了比較高的識別精度,并開始走向實際應用階段。ATT、歐洲電信
    發表于 11-02 16:14 ?0次下載
    DSP嵌入式<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別系統</b>的設計<b class='flag-5'>方案</b>

    基于MAP+CMLLR的說話識別中發聲力度問題

    為了改善發聲力度對說話識別系統性能的影響,在訓練語音存在少量耳語、高喊語音數據的前提下,提出了使用最大后驗概率(MAP)和約束最大似然線性回歸(CMLLR)相結合的方法來更新說話
    發表于 12-05 15:21 ?0次下載
    基于MAP+CMLLR的<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別</b>中發聲力度問題

    一種新的說話識別系統框架

    針對目前說話識別系統的效率問題,采用集成算法的策略,提出一種新的說話識別系統框架。首先,考慮
    發表于 01-08 10:17 ?0次下載

    基于CS的說話識別算法

    提出了一種基于壓縮感知(CS) 的說話識別算法以及在ARM 系統中的實現,首先,介紹壓縮感知理論框架,提出說話
    發表于 01-18 17:33 ?3次下載
    基于CS的<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別</b>算法

    基于TDSDM642EVM數字處理芯片實現實時說話識別系統的設計

    說話識別又稱聲紋識別,是通過說話的聲音特征進行身份認證的一種生物特征
    發表于 08-06 13:17 ?857次閱讀
    基于TDSDM642EVM數字處理芯片實現實時<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別系統</b>的設計

    基于GMM的實時說話識別系統

    電子發燒友網站提供《基于GMM的實時說話識別系統.pdf》資料免費下載
    發表于 10-08 10:19 ?0次下載
    基于GMM的實時<b class='flag-5'>說話</b><b class='flag-5'>人</b><b class='flag-5'>識別系統</b>
    百家乐赌博是否违法| 线上百家乐赌法| 碌曲县| 海尔百家乐的玩法技巧和规则 | 雁荡棋牌游戏| 百家乐公式论坛| 百家乐官网羸钱法| 托克逊县| 大发888真人娱乐场游戏平台| 邯郸百家乐园怎么样| 真人百家乐官网的玩法技巧和规则| 张家口市| 大发888网页版游戏| 百家乐怎么押钱| 百家乐游戏如何玩| 百家乐官网真人游戏娱乐场| 百家乐官网怎么注册| 百家乐1元投注| 做生意摆放什么会招财| 百家乐官网知识技巧玩法| 中牟县| 百家乐只打闲打法| 百家乐书籍| 百家乐风云论坛| 网址百家乐官网的玩法技巧和规则 | 任你博百家乐的玩法技巧和规则| 百家乐视频二人雀神| 百家乐游戏公司| 百家乐官网靠什么赢| 拉斯维加斯国际娱乐| 娱乐城开户送18| 娱乐城彩金| 云博| 澳门足球博彩官网| 皇冠现金网哪个最好| 大发888亚洲游戏咋玩| 大发888游戏平台dafa888gw | 1月24进房子风水好吗| 百家乐官网平注常赢玩法更| 华硕百家乐官网的玩法技巧和规则| 榆次百家乐官网的玩法技巧和规则 |