吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語音產(chǎn)業(yè)快速發(fā)展,帶動相關(guān)領(lǐng)域市場規(guī)模增長

電子工程師 ? 來源:網(wǎng)絡(luò)整理 ? 2018-01-30 11:16 ? 次閱讀

據(jù)行業(yè)預(yù)測,中國智能語音產(chǎn)業(yè)規(guī)模將達到101.4億元。而智能語音產(chǎn)業(yè)的快速發(fā)展,將帶動智能家居、智能汽車以及智能穿戴設(shè)備等相關(guān)領(lǐng)域市場規(guī)模增長上千億元。

智能語音市場規(guī)模得以如此神速擴張,并且應(yīng)用到多個領(lǐng)域,這必然離不開智能語音技術(shù)的不斷突破。那么,我們當前的語音技術(shù)達到了什么地步?換句話說,能夠?qū)崿F(xiàn)什么樣的人機互動效果呢?

以歐拉蜜團隊為代表,我們一起來看看這些年國內(nèi)智能語音行業(yè)的技術(shù)突破。

技術(shù)門檻高,首先得保證語音識別準確率

中國的語音識別研究起始于1958年,由中國科學院聲學所利用電子管電路識別10個元音。雖然與國外語音識別研究起步時間同步,但由于當時條件的限制,隨后一段時間內(nèi)技術(shù)的進展較為緩慢。

最初,我國語音技術(shù)的研究一直以學術(shù)界為主,隨后才有企業(yè)逐漸涉足這個領(lǐng)域。由于語音識別技術(shù)準入門檻高、人才稀缺,經(jīng)過多年研究與探索,一些國內(nèi)企業(yè)終于在這個行業(yè)冒頭,形成了“一超多強”的局面。

歐拉蜜團隊在智能語音方面的研究已達5年。初期,歐拉蜜以設(shè)計出一個中文理解能力超越Siri 的智能語音助理為目標,開始投入人工智能相關(guān)研究領(lǐng)域,而長遠的目標則是致力于提供全方位的人機交互解決方案。

這5年里,歐拉蜜攻破了不少技術(shù)難關(guān)。首先要解決的,就是語音識別的精準度。

語音人機交互面臨著多重技術(shù)難題。例如,人聲距離不能過遠、發(fā)音要標準、環(huán)境要安靜、不能持續(xù)對話、不能被打斷……

(歐拉蜜開發(fā)套件拾音測試視頻截圖)

歐拉蜜團隊重點解決了這些語音識別方面的問題。目前,歐拉蜜的人聲識別準確度高達90%,并且可實現(xiàn)超遠距離識別(最遠可準確識別距離8米的人聲)。

同時,歐拉蜜團隊研發(fā)了具有強抗噪能力的語音識別技術(shù)與核心算法,包括語音活性檢測(Voice Activity Detection | Speech Activity Detection),回聲消除算法(AcousticEcho Cancellation ),噪聲處理算法(Noise Reduction & Cancellation),混響處理算法(Reverberation)等多項專利技術(shù)。

歐拉蜜還為企業(yè)用戶提供深度定制服務(wù),比如對兒童聲音、嘈雜環(huán)境聲音進行訓(xùn)練,可達到特殊要求下的語音識別高準確度。

難點在于自然語言語義理解和處理

“能穿多少穿多少”,這句話的意思,到底是要你“多穿”呢,還是要你“少穿”呢。同樣的,中文語境下,類似的歧義句還不在少數(shù)。

例如,“中國隊大敗德國隊”,不知是中國贏了德國,還是德國贏了中國;“小王跟我請了假”,不知是小王向我請了假,還是小王和我都請了假……那么,在這種歧義的語境下,我們需要更多的信息來明確原句的意思。

比較常見的 NLP/NLU 現(xiàn)有技術(shù)與方案有這么幾種。一是基于關(guān)鍵詞和簡單規(guī)則,但這樣誤抓率高、歧義多,無法精準抓取參數(shù);二是基于ASR語法的擴展,但這種方式描述能力有限,可擴展性較低;三是基于統(tǒng)計的句法分析算法,這種算法準確率與性能不夠高,且不易處理上下文問題;最后呢,是處理語法擴展的編程,但這種程序復(fù)雜度很高。

那么,歐拉蜜是怎么解決這個問題的呢?

歐拉蜜團隊自主研發(fā)的語法描述語言(Syntax Language),可用靈活的規(guī)則來描述說法。同時,依托可全文檢索的結(jié)構(gòu)化知識庫,輔助確定語法參數(shù)的合法性,消除歧義。

歐拉蜜采用了結(jié)合規(guī)則和統(tǒng)計的有機算法、時間和數(shù)字識別技術(shù)、以編譯器技術(shù)動態(tài)解析和匹配規(guī)則,能夠?qū)崿F(xiàn)多維度的上下文支持能力,準確理解用戶的表達意圖。

(上圖為歐拉蜜語音助手截圖)

例如,當用戶連續(xù)輸入“今天上海的天氣”,“北京呢”,“買一張去那里的機票”。經(jīng)過算法處理以及數(shù)據(jù)庫檢索,歐拉蜜能夠結(jié)合上下文,準確將“北京呢”理解為“北京今天的天氣如何”,并給出當天北京的天氣狀況。

同樣的,歐拉蜜也能獲取最后一句中的“那里”指代的是“北京”,并為用戶反饋當?shù)厝ケ本┑臋C票信息。

以視覺行為偵測技術(shù)為輔助的語音人機交互

如果人機交互可以更加“智能”,那么它應(yīng)該擁有哪些能力呢?歐拉蜜團隊進一步改進了語音機器人的喚醒功能,使人機交互更加流暢。

市面上主流的智能音響,目前使用的都是語音喚醒。由于智能音響沒有屏幕,一切功能都是通過語音來操控,喚醒功能也不例外。往往會用一句喚醒話術(shù)(通常是產(chǎn)品的名稱)來作為啟動標志,當人們對著智能音響說出這句話時,智能音響就會進行答復(fù)并開始接收你傳遞給它的信息。

你可能會說,語音喚醒已經(jīng)很方便了,難道還能有什么改進余地嗎?

試想一下,日常生活中,當我們想要對另一人說話時常常會面向他,這時候,不需要叫對方的名字,對方也知道我們正在與他對話。如果機器也能做到這樣,那么“語音喚醒”都可以省略掉了。

(歐拉蜜人臉與視線追蹤視頻截圖)

歐拉蜜正是想賦予語音機器人這樣“人性化”的功能。因此,歐拉蜜團隊使用聲源定位并結(jié)合視線檢測(Eye Gaze Detection)技術(shù),來幫助機器人確認用戶的說話對象。這樣一來,機器人們除了知道你在說話,還能夠判斷出你是否是在跟它說話,并自動喚醒。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    789

    瀏覽量

    48904
收藏 人收藏

    評論

    相關(guān)推薦

    半導(dǎo)體材料市場規(guī)模不斷增長 國產(chǎn)化持續(xù)推進

    中銀證券針對我國半導(dǎo)體材料出具了研報,重點內(nèi)容如下: 1)我國半導(dǎo)體材料市場規(guī)模不斷增長,國產(chǎn)化持續(xù)推進。 AI驅(qū)動先進制程市場需求增長,半導(dǎo)體制造產(chǎn)能擴張,有望進一步帶動
    的頭像 發(fā)表于 12-20 13:44 ?220次閱讀

    全球半導(dǎo)體市場規(guī)模預(yù)測

    %的同比增長。這一數(shù)字顯示出半導(dǎo)體市場在技術(shù)創(chuàng)新、需求增長以及政策推動等多重因素作用下的強勁發(fā)展勢頭。 展望2025年,全球半導(dǎo)體市場規(guī)模
    的頭像 發(fā)表于 12-19 11:48 ?344次閱讀

    無人叉車的市場規(guī)模怎么樣?適合使用agv的企業(yè)有哪些共同點?

    無人叉車的市場規(guī)模正在穩(wěn)步增長,并展現(xiàn)出巨大的發(fā)展潛力。以下是對無人叉車市場規(guī)模及傾向使用無人叉車企業(yè)的詳細分析: 更多無人叉車/agv叉車咨詢請點擊 一、無人叉車
    的頭像 發(fā)表于 11-20 16:24 ?267次閱讀
    無人叉車的<b class='flag-5'>市場規(guī)模</b>怎么樣?適合使用agv的企業(yè)有哪些共同點?

    液壓市場規(guī)模穩(wěn)健增長,博科測試IPO上市迎發(fā)展良機

    市場規(guī)模達到了648億美金,2015年至2022年的復(fù)合年均增長率(CAGR)為3.4%。 在我國市場,液壓件行業(yè)的發(fā)展同樣令人矚目。2022年,中國液壓件
    的頭像 發(fā)表于 11-05 15:55 ?336次閱讀

    2024年全球芯片市場規(guī)模將達6298億美元

    預(yù)計在2024年將實現(xiàn)6298億美元的規(guī)模,同比增長率高達18.8%,這一增速相較于其一年前的預(yù)測(16.8%)有所上調(diào)。然而,對于2025年的市場前景,Gartner則略微調(diào)低了預(yù)期,將同比
    的頭像 發(fā)表于 10-30 11:45 ?1891次閱讀

    SoC芯片,市場規(guī)模大漲

    SoC芯片,市場規(guī)模大漲根據(jù)MarketsandMarkets的一份新報告,片上系統(tǒng)(SoC)市場規(guī)模預(yù)計將從2024年的1384.6億美元增長到2029年的2059.7億美元;預(yù)計從2024年到
    的頭像 發(fā)表于 10-09 08:06 ?473次閱讀
    SoC芯片,<b class='flag-5'>市場規(guī)模</b>大漲

    全球MCU市場規(guī)模持續(xù)增長,中國OEM廠商崛起

    近日,知名市場研究機構(gòu)YoleGroup發(fā)布了一份關(guān)于全球微控制器(MCU)市場的詳細報告。該報告預(yù)測,隨著科技的飛速發(fā)展和各行業(yè)的數(shù)字化轉(zhuǎn)型,全球MCU市場規(guī)模預(yù)計將持續(xù)
    的頭像 發(fā)表于 10-08 11:28 ?500次閱讀
    全球MCU<b class='flag-5'>市場規(guī)模</b>持續(xù)<b class='flag-5'>增長</b>,中國OEM廠商崛起

    淺析2024-2030中國RFID市場規(guī)模及未來發(fā)展趨勢

    近年來,中國RFID市場隨著物聯(lián)網(wǎng)、智能制造等領(lǐng)域發(fā)展,得到了廣泛的應(yīng)用。中國RFID市場規(guī)模持續(xù)擴大,增速穩(wěn)定。從具體的數(shù)據(jù)看,2019
    的頭像 發(fā)表于 08-16 16:09 ?952次閱讀

    GaN技術(shù)引領(lǐng)功率電子產(chǎn)業(yè)新風潮,預(yù)估2030年市場規(guī)模將突破43億美元

    快速增長。根據(jù)TrendForce集邦咨詢發(fā)布的《2024全球GaNPowerDevice市場分析報告》,2023年全球GaN功率元件市場規(guī)模約為2.71億美元,
    的頭像 發(fā)表于 08-15 10:39 ?560次閱讀
    GaN技術(shù)引領(lǐng)功率電子<b class='flag-5'>產(chǎn)業(yè)</b>新風潮,預(yù)估2030年<b class='flag-5'>市場規(guī)模</b>將突破43億美元

    2030年人形機器人電子皮膚市場規(guī)模將達90.5億!

    預(yù)計到2030年,人形機器人電子皮膚市場規(guī)模將達到90.5億元,年復(fù)合增長率為64.3%。
    的頭像 發(fā)表于 08-02 00:00 ?1202次閱讀
    2030年人形機器人電子皮膚<b class='flag-5'>市場規(guī)模</b>將達90.5億!

    功率半導(dǎo)體市場迎飛躍,預(yù)測2035年市場規(guī)模將增4.7倍

    %,市場規(guī)模將達到2813億日元。預(yù)計到2035年,這一市場規(guī)模將進一步擴大至10,763億日元,較2023年水平激增4.7倍。報告指出,功率半導(dǎo)體市場增長主要得
    的頭像 發(fā)表于 05-28 10:53 ?615次閱讀
    功率半導(dǎo)體<b class='flag-5'>市場</b>迎飛躍,預(yù)測2035年<b class='flag-5'>市場規(guī)模</b>將增4.7倍

    智能算力存在缺口,AI服務(wù)器市場規(guī)模持續(xù)提升

    的資本支出將大幅增加。全球前四大云服務(wù)商資本支出調(diào)升,預(yù)計將從2023年的1400億美元提升至2024年的超過2000億美元。 ? AI 服務(wù)器市場規(guī)模持續(xù)增長 ? 近些年,人工智能技術(shù)在各個
    的頭像 發(fā)表于 05-22 00:14 ?3159次閱讀

    英飛凌2023年全球汽車半導(dǎo)體市場規(guī)模增長16.5%,首次實現(xiàn)領(lǐng)跑

    英飛凌科技在2023年持續(xù)擴大其在汽車半導(dǎo)體市場的領(lǐng)先優(yōu)勢。TechInsights的最新研究顯示,2023年全球汽車半導(dǎo)體市場規(guī)模增長16.5%,創(chuàng)下692億美元的記錄。
    的頭像 發(fā)表于 04-18 11:29 ?1087次閱讀

    人形機器人領(lǐng)域六維力傳感器市場規(guī)模將達138.40億元

    隨著人形機器人量產(chǎn)及商業(yè)化進程的推進,高工機器人產(chǎn)業(yè)研究所(GGII)預(yù)測,到2030年,全球人形機器人領(lǐng)域力傳感器市場規(guī)模將達328.06億元,其中人形機器人領(lǐng)域六維力傳感器
    的頭像 發(fā)表于 04-01 16:29 ?1702次閱讀
    人形機器人<b class='flag-5'>領(lǐng)域</b>六維力傳感器<b class='flag-5'>市場規(guī)模</b>將達138.40億元

    以太網(wǎng)交換芯片市場規(guī)模

    以太網(wǎng)交換芯片市場規(guī)模在近年來呈現(xiàn)穩(wěn)步增長的態(tài)勢。根據(jù)公開數(shù)據(jù),2022年中國以太網(wǎng)交換芯片市場的銷售規(guī)模已經(jīng)增長到132.45億元,201
    的頭像 發(fā)表于 03-21 16:27 ?1373次閱讀
    大发888投注大发娱乐| 大发888最新信息| 百家乐扫瞄光纤洗牌机扑克洗牌机扑克洗牌机| 电子百家乐官网打法| 做生意佩戴什么纳财| 百家乐平台开户哪里优惠多| 王子百家乐的玩法技巧和规则| 基础百家乐博牌规| 台南市| 宝清县| 888百家乐官网的玩法技巧和规则 大发百家乐官网的玩法技巧和规则 | 赌场百家乐官网破解| 百家乐官网tt赌场娱乐网规则| 百家乐搏牌| 大发888娱乐场 手机版| 百家乐官网有电脑游戏吗| 网上百家乐官网是不是真的| 百家乐是咋玩法| 在线棋牌游戏平台| 百家乐官网怎样出千| 奇迹百家乐的玩法技巧和规则| 皇冠网注册送彩金| JJ百家乐的玩法技巧和规则| 网上百家乐官网网址| 好用百家乐分析软件| 茌平县| 百家乐出千的高科技| 百家乐官网游戏补牌规则| 正品百家乐游戏| 真人百家乐官网好不好玩| 百家乐游戏机博彩正网| 汝城县| 威尼斯人娱乐城官方网| 百家乐官网软件代理| 海南博彩bocai0898| 百家乐官网网址官网| 时时博在线娱乐城| 南京百家乐赌博现场被| 百家乐官网筹码方形| 大发888bet娱乐场下载| 百家乐de概率|