吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

玩轉(zhuǎn)語音合成芯片(TTS芯片),看這一篇就夠了

智能語音 ? 來源:智能語音 ? 作者:智能語音 ? 2024-03-19 18:13 ? 次閱讀

前言
什么是語音合成芯片:語音合成芯片也稱為TTS芯片,即文字轉(zhuǎn)語音芯片,是一種能夠?qū)⑤斎氲奈淖?a target="_blank">信息轉(zhuǎn)換為語音輸出的芯片。通過TTS芯片,我們可以將文字信息轉(zhuǎn)化為自然語音,實(shí)現(xiàn)人機(jī)語音交互。
語音合成芯片的應(yīng)用非常廣泛。例如,在智能家居領(lǐng)域,它可以用于語音控制家電設(shè)備;在車載設(shè)備中,它可以實(shí)時(shí)播報(bào)導(dǎo)航信息或交通提醒;在醫(yī)療設(shè)備中,它可以幫助醫(yī)生或患者獲取語音形式的醫(yī)療信息;在機(jī)器人領(lǐng)域,它使得機(jī)器人能夠與人類進(jìn)行語音交互,提高人機(jī)交互的便捷性和自然性。

wKgZomX5OteAMkkyAACVX1ew54M478.png

一、芯片介紹
我們以市場(chǎng)中主流的TTS芯片SYN8086為例,它是一款性/價(jià)比更高,效果更自然的一款高端語音合成芯片。本芯片通過UART接口,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語音(或TTS語音)的轉(zhuǎn)換。
二、功能介紹
①、支持清晰、自然、準(zhǔn)確的任意中文文本的合成,文本編碼可采用GB2312、GBK、Unicode和UTF8四種編碼方式。
②、芯片支持文本智能分析處理功能,對(duì)常見的數(shù)值、電話號(hào)碼、時(shí)間日期、度量衡符號(hào)等格式的文本,芯片能夠根據(jù)內(nèi)置的文本匹配規(guī)則進(jìn)行正確的識(shí)別和處理。
③、支持多音字和姓氏處理、多個(gè)發(fā)音人、音量、語速、語調(diào)調(diào)整、提示音等
④、支持低功耗模式、UART通訊方式。支持多種控制命令等
三、應(yīng)用場(chǎng)景
- 車載終端 智慧停車 智能家居 智能鬧鐘
- 考勤終端 公交報(bào)站 智能手表 智能家電
- 排隊(duì)叫號(hào) 預(yù)警終端 智能門鈴 智能藥盒
- 儀器儀表 智能玩具 智能門鎖 智能穿戴
- 語音對(duì)講 自助終端 血壓計(jì) 充電樁

wKgZomX5O1GADNUPAAKOcoBgqfc777.png

四、最小系統(tǒng)
- 最小系統(tǒng)包括:控制器模塊、語音合成芯片、功放模塊和喇叭。
- 主控制器和語音合成芯片之間通過UART接口連接,主控芯片UART接口向語音合成芯片發(fā)送控制命令和文本,語音合成芯片把接收到的文本合成為語音信號(hào)輸出,輸出的信號(hào)經(jīng)功率放大器進(jìn)行放大后連接到喇叭進(jìn)行播放。

wKgaomX5O4GAdapdAACtirs-b9M286.png

五、軟件設(shè)計(jì)
1、串口命令
說明:上位機(jī)通過串口發(fā)送給語音合成芯片的所有命令和數(shù)據(jù)都需要用“幀”的方式進(jìn)行封裝后傳輸。
- 公共命令匯總

wKgZomX5PL2AWtwpAAE03pr5GqQ665.png

- 語音合成命令匯總

wKgaomX5PM6AAnIOAAClUV3kLhI091.png

舉例:播放文本編碼格式為 “GBK” 的文本“宇音天下”
命令幀:0xFD 0x00 0x0A 0x01 0x01 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2

wKgaomX5POCAGgaAAAB3hx72uZU410.png

2、控制標(biāo)記
說明:漢字博大精深的文化底蘊(yùn),和當(dāng)前技術(shù)發(fā)展的限制,語音合成還不能做到百分之百的準(zhǔn)確。為滿足客戶在各種復(fù)雜環(huán)境的個(gè)性化需求,特推出以下文本控制標(biāo)記,用于靈活控制漢字發(fā)音的變化。

- 部分控制標(biāo)記

wKgaomX5PPuATTvkAACBgHe4xCY797.png

wKgaomX5PQqAa8O9AAD2ERb06Co485.png

- 控制標(biāo)記舉例:

wKgaomX5PRqAQgahAABeWNKx8u0054.png

舉例:設(shè)置TTS音量為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x76 0x31 0x30 0x5D
舉例:設(shè)置TTS語速為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x73 0x31 0x30 0x5D

3、提示音
SYN8086語音合成芯片內(nèi)集成了多首聲音提示音,可用于不同行業(yè)不同場(chǎng)合的信息提醒、報(bào)警等功能。例如:刷卡音,門鈴音,警報(bào)音等。
- 部分提示音舉例

wKgaomX5PTyAVpCYAADT2eY7IB4248.png

舉例:播放名稱為“sound901”的提示音
命令幀:FD 00 0A 01 01 73 6F 75 6E 64 39 30 31

4、C語言范例

#include #include void main(void) { /需要發(fā)送的文本******************/ char code text[ ] = {"歡迎使用宇音天下研發(fā)的語音合成芯片"}; unsigned char headOfFrame[5]; unsigned char length ; unsigned int i = 0; length = strlen(text); //需要發(fā)送文本的長(zhǎng)度 /串口的初始化********************/ TL1 = 0xFA; // 在11.0592MHz 下,設(shè)置波特率9600bps,工作方式2 TH1 = 0xFA; TMOD = 0x20; SCON = 0x50; // 串口工作方式1,允許接收 PCON = 0x80; EA = 0; REN = 1; TI = 0; //發(fā)送中斷標(biāo)志位置零 RI = 0; //接收中斷標(biāo)志位置零 TR1 = 1; //定時(shí)器1 用作波特率發(fā)生 /發(fā)送過程*********************/ headOfFrame[0] = 0xFD ; //構(gòu)造幀頭FD headOfFrame[1] = 0x00 ; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的高字節(jié) headOfFrame[2] = length + 2; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的低字節(jié) headOfFrame[3] = 0x01 ; //構(gòu)造命令字:合成播放命令 headOfFrame[4] = 0x01 ; //構(gòu)造命令參數(shù):編碼格式為GBK for(i = 0; i

六、硬件設(shè)計(jì)
1、通訊方式
語音合成芯片支持UART接口通訊方式,可通過UART 接口接收上位機(jī)發(fā)送的命令和數(shù)據(jù)。

wKgZomX5PvyAQ0TOAAAz4FJE3PI000.png

2、引腳定義

wKgZomX5Pw2AcgYNAAPw1PBBLZA511.png

3、參考電路

wKgaomX5P96AakEnAAIlYcZoups919.png

4、電源電路設(shè)計(jì)
3.1V-4.2V單獨(dú)供電,接VCC口。POPEN、BAUD0、BAUD1、WAKEUP默認(rèn)均有上拉電阻,如果IO需要上拉請(qǐng)上拉到VDDIO,而不是VCC。

- 功放參考電路

wKgZomX7pTeANy6VAAESqXMif7Y557.png

以CS8126T為參考

5、芯片參數(shù)
- 特性極限值

wKgaomX7p5uAeh_lAAB-jJH89ik981.png


- 電壓工作范圍

wKgaomX7p6uALOphAAA5nRrmrg8604.png


6、模塊說明
- 模塊實(shí)物圖

wKgZomX7p7qAEH8MAAF_whG6BGU347.png

- 模塊尺寸

wKgaomX7p8uABle2AACiaKiwV-Y110.png



- 模塊引腳圖

wKgaomX7p9aAIKmvAACss9n2HrI718.png

- 模塊引腳定義

wKgaomX7p-GAGpwqAADLnsChdrA276.png

結(jié)語
智能語音技術(shù)正在引領(lǐng)人機(jī)交互進(jìn)入全新的時(shí)代。其卓越的語音處理能力、高度集成化和小型化設(shè)計(jì),以及不斷優(yōu)化的低功耗特性,使得語音合成芯片在智能家居、智能車載、可穿戴設(shè)備等多個(gè)領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。
在此,我們期待語音合成芯片技術(shù)的不斷創(chuàng)新與發(fā)展,為人與人、人與機(jī)器之間的溝通搭建起更加便捷、高效的橋梁,共同開啟智能語音交互的新篇章。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    10833
  • 語音合成芯片
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    7530
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人員定位工牌卡-TTS語音合成文字轉(zhuǎn)語音芯片WT3000T8應(yīng)用方案解析

    提高員工的工作效率和安全性。本文將詳細(xì)介紹種基于WT3000T8-32在線TTS芯片的方案,探討其在人員定位工牌卡中的應(yīng)用、市場(chǎng)潛力、功能特點(diǎn)和方案優(yōu)勢(shì)。
    的頭像 發(fā)表于 11-27 15:51 ?197次閱讀

    九芯語音合成芯片NVH-FLASH,看這一足矣!

    前言什么是語音合成芯片:簡(jiǎn)而言之,就是將文字信息轉(zhuǎn)化為語音信號(hào)輸出的電子器件。它能夠?qū)⒋鎯?chǔ)或接收到的文字內(nèi)容,通過內(nèi)部復(fù)雜的算法處理,轉(zhuǎn)換成自然流暢的
    的頭像 發(fā)表于 11-21 01:01 ?244次閱讀
    九芯<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>NVH-FLASH,看<b class='flag-5'>這一</b><b class='flag-5'>篇</b>足矣!

    九芯語音合成芯片NVH-FLASH,看這一足矣!

    NVH-FLASH系列語音芯片,支持多電壓供電,低功耗,音頻輸出清晰,支持多種控制模式,廣泛應(yīng)用于智能終端設(shè)備,實(shí)現(xiàn)自然流暢的語音交互,縮短產(chǎn)品上市周期,成為理想選擇。
    的頭像 發(fā)表于 11-20 11:48 ?323次閱讀
    九芯<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>NVH-FLASH,看<b class='flag-5'>這一</b><b class='flag-5'>篇</b>足矣!

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對(duì)話多功能支持

    TTS(Text To Speech )技術(shù)作為智能語音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語音輸出,為各類硬件設(shè)備提供便捷的語音提示服務(wù)。本方案正是基于唯創(chuàng)知音的離在線
    的頭像 發(fā)表于 10-25 10:36 ?313次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語種限制/AI對(duì)話多功能支持

    WT2605C TTS在線語音合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    作為款集成了在線TTS功能的藍(lán)牙語音芯片,憑借其卓越的性能和廣泛的應(yīng)用領(lǐng)域,正引領(lǐng)著智能語音技術(shù)的新風(fēng)尚。
    的頭像 發(fā)表于 09-12 15:54 ?369次閱讀
    WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    收款機(jī)TTS語音芯片新方案:WT3000T8,雙語合成流暢,字庫解碼多樣!

    :方案背景概述隨著科技的飛速發(fā)展,人工智能和語音識(shí)別技術(shù)在各個(gè)領(lǐng)域都得到了廣泛應(yīng)用。其中,文本轉(zhuǎn)語音TTS)技術(shù)以其獨(dú)特的優(yōu)勢(shì),在收款機(jī)語音
    的頭像 發(fā)表于 07-27 08:38 ?712次閱讀
    收款機(jī)<b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,雙語<b class='flag-5'>合成</b>流暢,字庫解碼多樣!

    【算能RADXA微服務(wù)器試用體驗(yàn)】+ GPT語音與視覺交互:4,文字轉(zhuǎn)語音

    文字轉(zhuǎn)語音使用的技術(shù)簡(jiǎn)稱為TTS般情況下我用的都是在線的EDGE-TTS服務(wù)。但非常幸運(yùn)的是,BM1684X上居然有適配好的本地運(yùn)行TTS
    發(fā)表于 07-15 23:18

    基于康養(yǎng)大模型和健康設(shè)備平臺(tái)的智能藍(lán)牙語音合成芯片VTX326

    AI健康監(jiān)護(hù)智能體攜手VTX326藍(lán)牙TTS語音合成芯片,為健康管理插上了智慧的翅膀,從日常監(jiān)測(cè)到個(gè)性化指導(dǎo),每個(gè)環(huán)節(jié)都融入了科技的便利與
    的頭像 發(fā)表于 07-03 11:33 ?438次閱讀
    基于康養(yǎng)大模型和健康設(shè)備平臺(tái)的智能藍(lán)牙<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>VTX326

    收款機(jī)TTS語音芯片新方案:WT3000T8,雙語合成流暢,字庫解碼多樣!

    TTS技術(shù)在收款機(jī)播報(bào)收銀中具有重要的應(yīng)用價(jià)值和發(fā)展前景。本方案采用WT3000T芯片增加語音功能。不但可用耳朵聽語音播報(bào)收款的情況等(依用戶需求設(shè)置),而且可以播放音樂或英語口語美文
    的頭像 發(fā)表于 06-26 11:17 ?748次閱讀
    收款機(jī)<b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,雙語<b class='flag-5'>合成</b>流暢,字庫解碼多樣!

    中英文語音合成芯片TTS芯片)WT3000T8-在ETC上的應(yīng)用案例

    隨著智能化浪潮的推進(jìn),ETC(電子不停車收費(fèi))系統(tǒng)已逐漸成為現(xiàn)代交通的重要組成部分。在這一背景下,唯創(chuàng)知音自主研發(fā)的WT3000T8中文轉(zhuǎn)語音合成芯片
    的頭像 發(fā)表于 05-28 09:47 ?504次閱讀

    為什么說TTS語音合成芯片的廣泛應(yīng)用,低功耗才是關(guān)鍵

    引言 在智能硬件日益普及的今天,每點(diǎn)能量的節(jié)約都是科技進(jìn)步的象征。尤其在語音合成芯片領(lǐng)域,如何在保證高性能輸出的同時(shí),實(shí)現(xiàn)能耗的最小化,是眾多開發(fā)者不懈追求的目標(biāo)。 今天,我們來揭秘
    的頭像 發(fā)表于 05-21 10:03 ?639次閱讀

    【解讀】VTX316 TTS語音合成芯片幾個(gè)很實(shí)用的應(yīng)用技巧

    ? 前言 VTX316是北京宇音天下科技有限公司最新推出的款更具性價(jià)比的中文TTS語音合成芯片,采用QFN32(4*4mm)封裝,體積更加
    的頭像 發(fā)表于 05-13 16:33 ?515次閱讀

    20多年專注語音合成芯片公司分享:TTS芯片端是如何達(dá)到100%精準(zhǔn)合成

    我國漢字文化博大精深,雖然現(xiàn)在語音合成技術(shù)發(fā)展較為成熟,但仍無法做到100%的智能分析和識(shí)別,來滿足人們的需求習(xí)慣。 例如漢字“”,在不同語境下有3種讀法,“一五一十”“路平安”“
    的頭像 發(fā)表于 05-06 15:45 ?678次閱讀

    WT3000T8-TTS語音合成芯片及應(yīng)用場(chǎng)景介紹

    TTS語音合成芯片種能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然語音的專用
    的頭像 發(fā)表于 04-18 18:03 ?972次閱讀

    亞馬遜發(fā)布史上最大文本轉(zhuǎn)語音模型BASE TTS

    亞馬遜的人工智能研究團(tuán)隊(duì)近日宣布,他們成功開發(fā)出了迄今為止規(guī)模最大的文本轉(zhuǎn)語音模型——BASE TTS。這款新模型擁有高達(dá)9.8億個(gè)參數(shù),不僅在規(guī)模上超越了之前的所有版本,還在能力上實(shí)現(xiàn)了質(zhì)的飛躍。
    的頭像 發(fā)表于 02-20 17:04 ?919次閱讀
    博彩乐百家乐官网平台| 百家乐德州扑克发牌盒| 至尊百家乐官网下载| 威尼斯人娱乐官方| 百家乐官网庄闲庄庄闲| 能赢钱的棋牌游戏| 百家乐投注法| 湘西| 百家乐赌博技巧网| 百家乐官网打闲赢机会多| 棋牌游戏大厅| 太阳城百家乐下载网址| 百家乐官网投注五揽式| 大发888 登陆不上| 百家乐出千大全| 百家乐官网有多少种游戏| 大发888 188| 百家乐庄闲当哪个好| 太阳城百家乐官网出千技术| 大发888网络赌博害人| 24山安葬择日| 博狗娱乐| 百家乐如何捕捉长龙| 状元百家乐官网的玩法技巧和规则| 伊宁市| 北京太阳城小区| 百家乐娱乐城提款| 天地人百家乐官网现金网| 现金网制作| 澳门百家乐赌| 百家乐官网缩水| 百家乐官网玩法皇冠现金网| bet365娱乐场| KTV百家乐的玩法技巧和规则| 博彩百家乐官网组选六六组| 百家乐官网隐者博客| 大发888游戏平台黄埔网| 星港城百家乐娱乐城| 百家乐官网赢钱秘籍鹰| 金都百家乐官网现金网| 六合彩特码开奖|