边锋棋牌的微博,现金网上牌九,博彩娱乐场官网白菜(中国)·官方网站

機器學(xué)習(xí)的快速發(fā)展，為智能語音處理奠定了堅實的理論和技術(shù)基礎(chǔ)。智能語音處理的主要特點是從大量的語音數(shù)據(jù)中學(xué)習(xí)和發(fā)現(xiàn)其中蘊含的規(guī)律，可以有效解決經(jīng)典語音處理難以解決的非線性問題，從而顯著提升傳統(tǒng)語音應(yīng)用的性能，也為語音新應(yīng)用提供性能更好的解決方案。

01 智能語音處理的基本概念

為簡化處理，經(jīng)典的語音處理方法一般都建立在線性平穩(wěn)系統(tǒng)的理論基礎(chǔ)之上，這是以短時語音具有相對平穩(wěn)性為前提條件的。但是，嚴(yán)格來講，語音信號是一種典型的非線性、非平穩(wěn)隨機過程，這就使得采用經(jīng)典的處理方法難以進(jìn)一步提升語音處理系統(tǒng)的性能，如語音識別系統(tǒng)的識別率等。

隨著機器人技術(shù)的不斷發(fā)展，以機器人智能語音交互為代表的語音新應(yīng)用迫切要求發(fā)展新的語音處理技術(shù)與手段，以提高語音處理系統(tǒng)的性能水平。

近十年來，人工智能技術(shù)正以前所未有的速度向前發(fā)展，機器學(xué)習(xí)領(lǐng)域不斷涌現(xiàn)的新技術(shù)、新算法，特別是新型神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)等極大地推動了語音處理的發(fā)展，為語音處理的研究提供了新的方法和技術(shù)手段，智能語音處理應(yīng)運而生。

至今為止，智能語音處理還沒有一個精確的定義。廣義上來說，在語音處理算法或系統(tǒng)實現(xiàn)中全部或部分采用智能化的處理技術(shù)或手段均可稱為智能語音處理。

02 智能語音處理的基本框架

“聲源-濾波器”模型雖然能夠有效地區(qū)分聲源激勵和聲道濾波器，對它們進(jìn)行高效的估計，但語音產(chǎn)生時發(fā)聲器官存在著協(xié)同動作，存在緊耦合關(guān)系，采用簡單的線性模型無法準(zhǔn)確描述語音的細(xì)節(jié)特征。

同時，語音是一種富含信息的信號載體，它承載了語義、說話人、情緒、語種、方言等諸多信息，分離、感知這些信息需要對語音進(jìn)行十分精細(xì)的分析，對這些信息的判別也不再是簡單的規(guī)則描述，單純對發(fā)聲機理、信號的簡單特征采用人工手段去分析并不現(xiàn)實。

類似于人類語言學(xué)習(xí)的思路，采用機器學(xué)習(xí)手段，讓機器通過“聆聽”大量的語音數(shù)據(jù)，并從語音數(shù)據(jù)中學(xué)習(xí)蘊含其中的規(guī)律，是有效提升語音信息處理性能的主要手段。與經(jīng)典語音處理方法僅限于通過提取人為設(shè)定特征參數(shù)進(jìn)行處理不同，智能語音處理最重要的特點就是在語音處理過程或算法中體現(xiàn)從數(shù)據(jù)中學(xué)習(xí)規(guī)律的思想。

圖1-5給出了智能語音處理的三種基本框架，圖中虛線框部分有別于經(jīng)典語音處理方法，包含了從數(shù)據(jù)中學(xué)習(xí)的思想，是智能語音處理的核心模塊。

詳談機器學(xué)習(xí)的智能語音處理技術(shù)

▲圖1-5 智能語音處理的基本框架

其中，圖1-5a是在經(jīng)典語音處理特征提取的基礎(chǔ)上，在特征映射部分融入了智能處理，是機器學(xué)習(xí)的經(jīng)典形式，圖1-5b和圖1-5c是表示學(xué)習(xí)的基本框架，其中圖1-5c是深度學(xué)習(xí)的典型框架，“深度層次化的抽象特征”是通過分層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來實現(xiàn)的。

03 智能語音處理的基本模型

智能語音處理是智能信息處理的一個重要研究領(lǐng)域，智能信息處理涉及的模型、方法、技術(shù)均可應(yīng)用于智能語音處理。智能語音處理的基本模型和技術(shù)主要來源于人工智能，機器學(xué)習(xí)作為人工智能的重要領(lǐng)域，是目前智能語音處理中最常用的手段，而機器學(xué)習(xí)中的表示學(xué)習(xí)和深度學(xué)習(xí)則是智能語音處理中目前最為成功的智能處理技術(shù)。

詳談機器學(xué)習(xí)的智能語音處理技術(shù)

▲圖1-6 AI/ML/RL/DL的關(guān)系圖

圖1-6展示了人工智能（Artificial Intelligence，AI）、機器學(xué)習(xí)（Machine Learning，ML）、表示學(xué)習(xí)（Representation Learning，RL）及深度學(xué)習(xí)（Deep Learning，DL）的相互關(guān)系。

下面列出了近年來在智能語音處理中常見的模型和技術(shù)。

1. 稀疏與壓縮感知

一個事物的表示形式?jīng)Q定了認(rèn)知該事物的難度。在信息處理中，具有稀疏特性的信號表示更易于被感知和辨別，反之則難以辨別。因此，尋找信號的稀疏表示是高效解決信息處理問題的一個重要手段。

利用冗余字典，可以學(xué)習(xí)信號自身的特點，構(gòu)造信號的稀疏表示，并進(jìn)一步降低采樣和處理的難度。這種字典學(xué)習(xí)方法為信息處理提供了新的視角。對語音信號采用字典學(xué)習(xí)，構(gòu)造語音的稀疏表示，為語音編碼、語音分離等應(yīng)用提供了新的研究思路。

2. 隱變量模型

語音的所有信息都包含在語音波形中，隱變量模型假設(shè)這些信息是隱含在觀測信號之后的隱變量。通過利用高斯建模、隱馬爾可夫建模等方法，隱變量模型建立了隱變量和觀測變量之間的數(shù)學(xué)描述，并給出了從觀測變量學(xué)習(xí)各模型參數(shù)的方法。

通過參數(shù)學(xué)習(xí)，可以將隱變量的變化規(guī)律挖掘出來，從而得到各種需要的隱含信息。隱變量模型大大提高了語音識別、說話人識別等應(yīng)用的性能，在很長一段時間內(nèi)都是智能語音處理的主流手段。

3. 組合模型

組合模型認(rèn)為語音是多種信息的組合，這些信息可以采用線性疊加、相乘、卷積等不同方式組合在一起。具體的組合方式中需要采用一系列模型參數(shù)，這些模型參數(shù)可以通過學(xué)習(xí)方式從大量語音數(shù)據(jù)中學(xué)得。這類模型的提出，有效改善了語音分離、語音增強等應(yīng)用的性能。

4. 人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)

人類面臨大量感知數(shù)據(jù)時，總能以一種靈巧的方式獲取值得注意的重要信息。模仿人腦高效、準(zhǔn)確地表示信息一直是人工智能領(lǐng)域的核心挑戰(zhàn)。

人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Network，ANN）通過神經(jīng)元連接成網(wǎng)的方式，模擬了哺乳類動物大腦皮層的神經(jīng)通路。和生物的神經(jīng)系統(tǒng)一樣，ANN通過對環(huán)境輸入的感知和學(xué)習(xí)，可以不斷優(yōu)化性能。

隨著ANN的結(jié)構(gòu)越來越復(fù)雜、層數(shù)越來越多，網(wǎng)絡(luò)的表示能力也越來越強，基于ANN進(jìn)行深度學(xué)習(xí)成為ANN研究的主流，其性能相對于很多傳統(tǒng)的機器學(xué)習(xí)方法有較大幅度的提高。但同時，深度學(xué)習(xí)對輸入數(shù)據(jù)的要求也越來越高，通常需要有海量數(shù)據(jù)的支撐。

ANN很早就應(yīng)用到了語音處理領(lǐng)域，但由于早期受到計算資源的限制，神經(jīng)網(wǎng)絡(luò)層數(shù)較少，語音處理應(yīng)用性能難以提升，直到近年來深層神經(jīng)網(wǎng)絡(luò)的計算資源、學(xué)習(xí)方法有了突破之后，基于神經(jīng)網(wǎng)絡(luò)的語音處理性能才有了顯著的提升。

深度神經(jīng)網(wǎng)絡(luò)可以學(xué)到語音信號中各種信息間的非線性關(guān)系，解決了傳統(tǒng)語音處理方法難以解決的問題，已經(jīng)成為當(dāng)前智能語音處理的重要技術(shù)手段。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3312

瀏覽量
49226
機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8439

瀏覽量
133087
智能語音

智能語音

+關(guān)注

關(guān)注
10

文章
789

瀏覽量
48904

機器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用

在本章中，我們將討論機器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用。首先，定義機器學(xué)習(xí)，并

發(fā)表于 10-18 16:08 ?2408次閱讀

【TL6748 DSP申請】基于DSP的語音識別技術(shù)研究及實現(xiàn)

申請理由：在校大三學(xué)生，電子信息工程信號處理方向，特別想學(xué)習(xí)一下DSP信號處理技術(shù)。學(xué)習(xí)過隨機信號分析、信號系統(tǒng)課程并且正在

發(fā)表于 10-09 15:08

智能語音機器人

` 本帖最后由星希望532 于 2015-12-2 20:06 編輯作品名稱：基于微型操作系統(tǒng)的智能多平臺控制語音機器人http://v.youku.com/v_show

發(fā)表于 12-02 19:08

基于深度學(xué)習(xí)技術(shù)的智能機器人

——工業(yè)機器人的智能化程度要求也越來越高，采用深度學(xué)習(xí)技術(shù)為工業(yè)機器人賦能是目前各大廠商的統(tǒng)一認(rèn)知。本文結(jié)合實際案例，簡要說明一下

發(fā)表于 05-31 09:36

請問電銷機器人智能語音識別的原理是什么？

一個人們最為關(guān)心的問題大概就是，電銷機器人如何做到語音識別，通俗來講，就是電銷機器人如何“聽懂”人們說話？其實語音識別技術(shù)是人工

發(fā)表于 06-12 14:03

人工智能和機器學(xué)習(xí)的前世今生

如何傳授給計算機的過程。任何機器使用算法以智能方式執(zhí)行任務(wù)，這就是展現(xiàn)的人工智能。機器學(xué)習(xí)是人工智能

發(fā)表于 08-27 10:16

人工智能——MATLAB圖像處理及機器學(xué)習(xí)

視覺、通訊、計算金融學(xué)、控制設(shè)計、機器人學(xué)等等。為了幫助大家更好的學(xué)習(xí)機器學(xué)習(xí)和圖像處理，我們上線了《人工智能—MATLAB圖像

發(fā)表于 07-01 15:05

【平頭哥CB5654語音開發(fā)板試用連載】智能取貨機器人語音交互模組

項目名稱：智能取貨機器人語音交互模組試用計劃：申請理由本人在機器人控制有七年多的學(xué)習(xí)和開發(fā)經(jīng)驗，曾參與設(shè)計過類似巡檢機器人，參與語音交互硬件

發(fā)表于 02-25 16:05

AI智能語音機器人揭秘讓企業(yè)電銷輕松拓客神器

AI智能語音機器人是一款基于人工智能開發(fā)的，適用于產(chǎn)品業(yè)務(wù)或服務(wù)推廣需求的語音營銷服務(wù)平臺!通過精準(zhǔn)語音

發(fā)表于 07-21 22:54

機器人技術(shù)和機器學(xué)習(xí)

機器人技術(shù)和機器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)（IoT）來傳遞信息、共享資源。無論是智能

發(fā)表于 12-20 06:03

什么是人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理？

垂直領(lǐng)域得到廣泛應(yīng)用。根據(jù)2020年的一項估計，37% 的組織已經(jīng)在使用這種或那種形式的人工智能。大多數(shù)人工智能的應(yīng)用是特定的技術(shù)，如計算機視覺、自然語言處理、

發(fā)表于 03-22 11:19

《移動終端人工智能技術(shù)與應(yīng)用開發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

人工智能打發(fā)展是算法優(yōu)先于實際應(yīng)用。近幾年隨著人工智能的不斷普及，許多深度學(xué)習(xí)算法涌現(xiàn)，從最初的卷積神經(jīng)網(wǎng)絡(luò)（CNN）到機器學(xué)習(xí)算法的時代。

發(fā)表于 02-17 11:00

智能語音機器人的使用誤區(qū)你知道嗎

電銷機器人=AI人工智能+語音識別技術(shù)+語音知識庫+話術(shù)邏輯+智能

發(fā)表于 07-04 14:29 ?1173次閱讀

機器學(xué)習(xí)可以分為哪幾類？機器學(xué)習(xí)技術(shù)有哪些？

機器學(xué)習(xí)可以分為哪幾類？機器學(xué)習(xí)技術(shù)有哪些機器學(xué)習(xí)

發(fā)表于 08-17 16:11 ?5841次閱讀

機器學(xué)習(xí)技術(shù)是什么？機器學(xué)習(xí)技術(shù)在新型電力系統(tǒng)安全穩(wěn)定中的應(yīng)用

一些能夠推斷未知數(shù)據(jù)的規(guī)則和模型。機器學(xué)習(xí)技術(shù)目前已經(jīng)廣泛應(yīng)用于許多領(lǐng)域，如圖像和語音識別、自然語言處理、金融風(fēng)險管理等等。在電力系統(tǒng)安全

發(fā)表于 08-17 16:30 ?1179次閱讀

吴忠躺衫网络科技有限公司

搜索歷史

詳談機器學(xué)習(xí)的智能語音處理技術(shù)

評論

機器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用

【TL6748 DSP申請】基于DSP的語音識別技術(shù)研究及實現(xiàn)

智能語音機器人

基于深度學(xué)習(xí)技術(shù)的智能機器人

請問電銷機器人智能語音識別的原理是什么？

人工智能和機器學(xué)習(xí)的前世今生

人工智能——MATLAB圖像處理及機器學(xué)習(xí)

【平頭哥CB5654語音開發(fā)板試用連載】智能取貨機器人語音交互模組

AI智能語音機器人揭秘讓企業(yè)電銷輕松拓客神器

機器人技術(shù)和機器學(xué)習(xí)

什么是人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理？

《移動終端人工智能技術(shù)與應(yīng)用開發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

智能語音機器人的使用誤區(qū)你知道嗎

機器學(xué)習(xí)可以分為哪幾類？機器學(xué)習(xí)技術(shù)有哪些？

機器學(xué)習(xí)技術(shù)是什么？機器學(xué)習(xí)技術(shù)在新型電力系統(tǒng)安全穩(wěn)定中的應(yīng)用