优博娱乐在线,第一娱乐场官网测试,万宝路娱乐城金杯娱乐城(中国)·官方网站

本期導(dǎo)讀

-Hi Siri，今天天氣怎么樣？

-今天天氣晴，18℃至27℃，空氣質(zhì)量指數(shù)36，優(yōu)。

手機(jī)、手表、音箱等智能設(shè)備極大地便利了我們的生活，隨著語(yǔ)音交互設(shè)備的發(fā)展，智能交互依然面臨很多挑戰(zhàn)。

我們每天要說(shuō)成百上千句話，長(zhǎng)短不一。即便是一些轉(zhuǎn)瞬即逝的口頭語(yǔ)，也可以成為傳達(dá)自我意識(shí)的載體，向他人準(zhǔn)確傳達(dá)信息。可語(yǔ)言似乎是人類群體特有的專利，在過(guò)往的時(shí)間中，想借助語(yǔ)言與其他物種、物體建立清晰明確溝通關(guān)系的可能性無(wú)限趨近于零，直到智能語(yǔ)音技術(shù)的出現(xiàn)。

作為最早落地的人工智能技術(shù)之一，AI語(yǔ)音技術(shù)已經(jīng)得到了長(zhǎng)足的發(fā)展。如今，智能語(yǔ)音技術(shù)已經(jīng)被廣泛集成的就是家居產(chǎn)品之中。在即將到來(lái)的萬(wàn)物互聯(lián)時(shí)代，以語(yǔ)音交互為主的智能設(shè)備無(wú)疑將極具競(jìng)爭(zhēng)力與吸引力。仔細(xì)一想，一眾充滿科技感與未來(lái)感的智能設(shè)備，將天然具備人類最熟悉的“原始交互方式”，也頗有些化繁為簡(jiǎn)、返璞歸真的意味。

語(yǔ)音交互設(shè)備的“助聽(tīng)器”——ASR

在復(fù)雜環(huán)境中，我們總是可以忽略或弱化無(wú)關(guān)噪聲，集中注意力進(jìn)行溝通，但語(yǔ)音交互設(shè)備在如此環(huán)境中只會(huì)無(wú)所適從，不免陷入“交互尚未開(kāi)始，便已結(jié)束”的囧境。故此，設(shè)備擁有對(duì)各類“聲學(xué)場(chǎng)景”的聲源信號(hào)進(jìn)行處理、優(yōu)化功能的必要性不言而喻。而借助降噪NS、語(yǔ)音增強(qiáng)SE等技術(shù)，可以對(duì)聲學(xué)場(chǎng)景中的非語(yǔ)音噪音信號(hào)進(jìn)行抑制，從含有噪音的語(yǔ)音信號(hào)中提取純凈語(yǔ)音，提升語(yǔ)音識(shí)別效果，讓語(yǔ)音交互設(shè)備可以分辨、傾聽(tīng)出目標(biāo)聲音，進(jìn)而為后續(xù)的語(yǔ)音交互掃清障礙。

在語(yǔ)音識(shí)別技術(shù)（ASR）的加持下，語(yǔ)音交互設(shè)備能對(duì)聲音信號(hào)進(jìn)行特征提取，提取而出的“特征”會(huì)作為參數(shù)，為模型計(jì)算做準(zhǔn)備。簡(jiǎn)單理解就是將語(yǔ)音信息數(shù)字化，再通過(guò)相應(yīng)的模型對(duì)數(shù)字化信息進(jìn)行計(jì)算。后續(xù)通過(guò)聲學(xué)模型計(jì)算得出相應(yīng)的音素（即把聲音轉(zhuǎn)成音素），其目的是根據(jù)音素來(lái)找到對(duì)應(yīng)的漢字或者單詞，最終轉(zhuǎn)換成設(shè)備可以理解的文本。

語(yǔ)音交互設(shè)備的“聲卡”——TTS

基于語(yǔ)音合成技術(shù)（TTS），語(yǔ)音交互設(shè)備可對(duì)文本逐句分析，進(jìn)行詞匯、語(yǔ)法的和語(yǔ)義的分析，以確定句子的低層結(jié)構(gòu)和每個(gè)字的所對(duì)應(yīng)的音素組成，包括文本的斷句、字詞切分、多音字處理以及數(shù)字處理等。

在內(nèi)置芯片和神經(jīng)網(wǎng)絡(luò)技術(shù)的支持下，語(yǔ)音交互設(shè)備可把處理好的文本所對(duì)應(yīng)的單字或短語(yǔ)從語(yǔ)音合成庫(kù)中提取，使語(yǔ)言學(xué)描述轉(zhuǎn)化成言語(yǔ)波形，即把文字智能地轉(zhuǎn)化為自然語(yǔ)音流。至此，一次完整的語(yǔ)音交互便成功完成。當(dāng)然，在特有的智能語(yǔ)音控制器作用下，文本輸出的語(yǔ)音音律將會(huì)更加流暢，使得聽(tīng)者在聽(tīng)取信息時(shí)感覺(jué)自然、毫無(wú)機(jī)器語(yǔ)音輸出的冷漠與生澀感。

寫(xiě)在最后

誠(chéng)然，已普遍應(yīng)用于智能家居設(shè)備中的語(yǔ)音交互技術(shù)仍面臨諸多挑戰(zhàn)，在設(shè)備喚醒率、識(shí)別率、誤報(bào)率、環(huán)境降噪等方面仍有改進(jìn)的空間。但毫無(wú)疑問(wèn)，在未來(lái)語(yǔ)音作為人類最自然、最便捷的溝通方式，將會(huì)成為所有設(shè)備和產(chǎn)品至關(guān)重要的入口和人與機(jī)器之間的通信紐帶，而強(qiáng)邏輯、無(wú)視覺(jué)或者弱視覺(jué)的智能語(yǔ)音技術(shù)也會(huì)找到更多用武之地。

原文標(biāo)題：智能交互的盡頭是聊天？

文章出處：【微信公眾號(hào)：安富利】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

ASR

ASR

+關(guān)注

關(guān)注
2

文章
43

瀏覽量
18804
TTS

TTS

+關(guān)注

關(guān)注
0

文章
42

瀏覽量
10834
語(yǔ)音交互

語(yǔ)音交互

+關(guān)注

關(guān)注
3

文章
287

瀏覽量
28072

原文標(biāo)題：智能交互的盡頭是聊天？

文章出處：【微信號(hào)：AvnetAsia，微信公眾號(hào)：安富利】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí)：AI智能語(yǔ)音播報(bào)

一、DEMO思路在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中，我們將使用ArkTS開(kāi)發(fā)語(yǔ)言創(chuàng)建一個(gè)簡(jiǎn)單的AI智能語(yǔ)音播報(bào)應(yīng)用。該應(yīng)用能夠接收用戶輸入的文本，并使用TTS

發(fā)表于 01-06 15:33

【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

項(xiàng)目二維碼下圖該作品通過(guò)采集飲水?dāng)?shù)據(jù)，多種交互方式，數(shù)據(jù)分析處理，提醒用戶定期飲水，達(dá)到保持健康的作用。主要功能是語(yǔ)音識(shí)別。 ASR-PRO語(yǔ)音模塊是一款高度集成的智能

發(fā)表于 01-02 18:15

基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制

作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù)，它通過(guò)集成自然語(yǔ)言處理（NLP）、語(yǔ)音識(shí)別（ASR

發(fā)表于 12-03 16:44 ?379次閱讀

ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別

ASR（Automatic Speech Recognition，自動(dòng)語(yǔ)音識(shí)別）與傳統(tǒng)語(yǔ)音識(shí)別在多個(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩者的對(duì)比：一、技術(shù)基礎(chǔ)

發(fā)表于 11-18 15:22 ?643次閱讀

ASR技術(shù)的未來(lái)發(fā)展趨勢(shì) ASR系統(tǒng)常見(jiàn)問(wèn)題及解決方案

自動(dòng)語(yǔ)音識(shí)別（Automatic Speech Recognition，簡(jiǎn)稱ASR）技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支，它使得機(jī)器能夠理解和處理人類語(yǔ)言。隨著技術(shù)的進(jìn)步，

發(fā)表于 11-18 15:20 ?1188次閱讀

ASR和機(jī)器學(xué)習(xí)的關(guān)系

語(yǔ)音識(shí)別技術(shù)的目標(biāo)是將人類語(yǔ)音轉(zhuǎn)換成可讀的文本。這項(xiàng)技術(shù)在多個(gè)領(lǐng)域都有應(yīng)用，包括語(yǔ)音助手、語(yǔ)音轉(zhuǎn)

發(fā)表于 11-18 15:16 ?397次閱讀

ASR在智能家居中的應(yīng)用

隨著科技的飛速發(fā)展，人工智能技術(shù)（AI）已經(jīng)滲透到我們生活的方方面面，其中自動(dòng)語(yǔ)音識(shí)別（Automatic Speech Recognition，簡(jiǎn)稱ASR）技術(shù)在智能家居領(lǐng)域的應(yīng)用尤

發(fā)表于 11-18 15:15 ?609次閱讀

ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

ASR（Automatic Speech Recognition）語(yǔ)音識(shí)別技術(shù)，是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破，能將人類語(yǔ)音轉(zhuǎn)換為文本，廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。

發(fā)表于 11-18 15:12 ?1029次閱讀

語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

TTS（Text To Speech ）技術(shù)作為智能語(yǔ)音領(lǐng)域的重要組成部分，能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語(yǔ)音輸出，為各類硬件設(shè)備提供便捷的

發(fā)表于 10-25 10:36 ?313次閱讀

語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

前言forewordTTS（TextToSpeech）技術(shù)作為智能語(yǔ)音領(lǐng)域的重要組成部分，能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語(yǔ)音輸出，為各類硬件設(shè)備提供便捷的

發(fā)表于 10-25 08:11 ?299次閱讀

WT2605C TTS在線語(yǔ)音合成芯片：賦能多行業(yè)領(lǐng)域，引領(lǐng)產(chǎn)品智能化

在當(dāng)今科技日新月異的時(shí)代，語(yǔ)音技術(shù)正逐步滲透到我們生活的方方面面，而TTS（Text-To-Speech，文本到語(yǔ)音）技術(shù)作為其中的重要一環(huán)

發(fā)表于 09-12 15:54 ?369次閱讀

整合離線語(yǔ)音識(shí)別ASR和TTS，內(nèi)存映射時(shí)發(fā)生內(nèi)存不足怎么解決？

整合TTS和ASR，發(fā)現(xiàn)識(shí)別模型和TTS字典映射沖突，應(yīng)該是只有4M的數(shù)據(jù)空間可以映射導(dǎo)致的，換了16M模組也不行，應(yīng)該不是flash的問(wèn)題，測(cè)試找到返回錯(cuò)誤0x101的位置是按頁(yè)映射的函數(shù)里

發(fā)表于 06-28 07:34

智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等技術(shù)，實(shí)現(xiàn)人與機(jī)器之間自然語(yǔ)言的交流和

發(fā)表于 05-23 15:14 ?430次閱讀

WT3000T8-TTS語(yǔ)音合成芯片及應(yīng)用場(chǎng)景介紹

TTS語(yǔ)音合成芯片是一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然語(yǔ)音的專用芯片。它通過(guò)內(nèi)置的語(yǔ)音合成算法和音頻處理單元，實(shí)現(xiàn)了文本到語(yǔ)音的高效轉(zhuǎn)換，為各種智

發(fā)表于 04-18 18:03 ?972次閱讀

玩轉(zhuǎn)語(yǔ)音合成芯片（TTS芯片），看這一篇就夠了

什么是語(yǔ)音合成芯片：語(yǔ)音合成芯片也稱為TTS芯片，即文字轉(zhuǎn)語(yǔ)音芯片，是一種能夠?qū)⑤斎氲奈淖中畔⑥D(zhuǎn)換為語(yǔ)音輸出的芯片。通過(guò)

發(fā)表于 03-19 18:13 ?1533次閱讀