近日,階躍星辰在官方公眾號(hào)上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)端到端語(yǔ)音大模型。該模型被譽(yù)為“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型”,標(biāo)志著我國(guó)在語(yǔ)音技術(shù)領(lǐng)域取得了新的里程碑。
據(jù)階躍星辰介紹,傳統(tǒng)的語(yǔ)音模型通常采用級(jí)聯(lián)方案,即先將用戶輸入的語(yǔ)音信息轉(zhuǎn)化為文本,再進(jìn)行二次轉(zhuǎn)化以生成語(yǔ)音輸出。這種方案不僅過(guò)程繁瑣,降低了傳輸效率,而且在轉(zhuǎn)化過(guò)程中容易折損掉包括情緒在內(nèi)的關(guān)鍵信息。這導(dǎo)致傳統(tǒng)語(yǔ)音模型存在時(shí)延長(zhǎng)、反應(yīng)慢、回答質(zhì)量和智能水平不足,以及情感表達(dá)空洞刻板等缺陷。
而階躍星辰推出的Step-1o模型則采用了端到端的語(yǔ)音方案,實(shí)現(xiàn)了語(yǔ)音理解和生成的一體化。這一創(chuàng)新設(shè)計(jì)不僅提升了模型的智商上限,還使其能夠更好地理解和表達(dá)情感,從而克服了傳統(tǒng)語(yǔ)音模型的諸多缺陷。
Step-1o千億參數(shù)端到端語(yǔ)音大模型的發(fā)布,不僅展示了階躍星辰在語(yǔ)音技術(shù)領(lǐng)域的深厚實(shí)力,也為我國(guó)語(yǔ)音技術(shù)的發(fā)展注入了新的活力。未來(lái),隨著該模型的不斷優(yōu)化和應(yīng)用推廣,相信將為用戶帶來(lái)更加智能、高效和自然的語(yǔ)音交互體驗(yàn)。
-
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28072 -
大模型
+關(guān)注
關(guān)注
2文章
2548瀏覽量
3169
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
靈初智能發(fā)布端到端具身模型Psi R0,實(shí)現(xiàn)復(fù)雜操作與泛化能力
準(zhǔn)確性超Moshi和GLM-4-Voice,端到端語(yǔ)音雙工模型Freeze-Omni
![準(zhǔn)確性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>語(yǔ)音</b>雙工<b class='flag-5'>模型</b>Freeze-Omni](https://file1.elecfans.com/web3/M00/02/8E/wKgZPGdg4PiAVGXYAAAsdXIlJDc171.png)
黑芝麻智能端到端算法參考模型公布
![黑芝麻智能<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>算法參考<b class='flag-5'>模型</b>公布](https://file1.elecfans.com/web3/M00/00/DC/wKgZO2dOicOAR7MvAAAoJkpKoYs915.png)
連接視覺(jué)語(yǔ)言大模型與端到端自動(dòng)駕駛
![連接視覺(jué)語(yǔ)言大<b class='flag-5'>模型</b>與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動(dòng)駕駛](https://file1.elecfans.com/web1/M00/F4/82/wKgaoWcsaSCAanLQAAJKOrcQaug740.png)
智駕進(jìn)程發(fā)力?小鵬、蔚來(lái)端到端模型上車
![智駕進(jìn)程發(fā)力?小鵬、蔚來(lái)<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>上車](https://file1.elecfans.com/web2/M00/08/F6/wKgaomb0tl6AEHRzAAhPkZbgvug271.png)
循環(huán)神經(jīng)網(wǎng)絡(luò)在端到端語(yǔ)音識(shí)別中的應(yīng)用
階躍星辰發(fā)布重磅大模型新品,引領(lǐng)AI新紀(jì)元
小鵬汽車發(fā)布國(guó)內(nèi)首個(gè)量產(chǎn)上車的端到端大模型
中國(guó)電信發(fā)布首個(gè)支持30種方言混說(shuō)語(yǔ)音大模型
小鵬汽車發(fā)布端到端大模型
通義千問(wèn)開(kāi)源千億級(jí)參數(shù)模型
理想汽車自動(dòng)駕駛端到端模型實(shí)現(xiàn)
![理想汽車自動(dòng)駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>實(shí)現(xiàn)](https://file1.elecfans.com/web2/M00/C8/16/wKgZomYYtiiAfxGbAAAYMmCF-Bs600.png)
牽手NVIDIA 元戎啟行端到端模型將搭載 DRIVE Thor芯片
![牽手NVIDIA 元戎啟行<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>將搭載 DRIVE Thor芯片](https://file1.elecfans.com/web2/M00/C5/A2/wKgZomYA9IuAM1MTAAgpBjcLFmM730.png)
評(píng)論