2019年3月3日,全球首個AI合成女主播“新小萌”正式上崗新華社,而她的第一個工作任務,便是參與到當下最熱門的十三屆全國人大二次會議(后文簡稱兩會)報道中。對此,“今日俄羅斯”電視臺網(wǎng)站、英國Daily Mail、美國Futurism等海外媒體進行了大幅報道,并表示“近年來,中國已成為全球領先的人工智能發(fā)展中心之一”。
作為第一個登上兩會的AI合成女主播,人們在驚嘆和稱贊之余,對于其背后由搜狗所開發(fā)的人工智能技術都無比好奇:這個在鏡頭前播報新聞的“新小萌”,是如何誕生的呢?它未來又將有哪些應用價值呢?
什么是AI合成主播?
比起機器千篇一律的冰冷面孔,用戶期待的是一個有溫度的真人形象。所謂AI合成主播,顧名思義,指的就是依靠搜狗的“分身”技術,來模擬出一個類似人類的AI主播進行播報。搜狗的這款產(chǎn)品就是以新華社主播屈萌為原型,她不僅會用和真人一樣的聲音進行播報,就連唇形、面部表情也能完全吻合。從新華社的新聞播報視頻來看,栩栩如生的AI合成女主播“新小萌”,在鏡頭前的形象與真人主播幾乎沒有什么區(qū)別。
AI合成主播在2018年的互聯(lián)網(wǎng)大會期間首次亮相,就引起了網(wǎng)絡上的一片熱議,被國內(nèi)外諸多媒體進行報道。2019年2月21日,AI合成主播宣布再次升級,從過去的“坐著播新聞”升級成結合肢體動作的“站立式播報”,進一步提升了合成主播的表現(xiàn)力,保持了搜狗在這一領域的全球領先。本次首個AI合成女主播參與兩會報道,更是成為了中國人工智能與傳媒業(yè)大膽融合并付諸規(guī)模化應用的典型案例。
首個AI合成女主播的背后,有哪些搜狗的“黑科技”?
作為開發(fā)AI合成主播的基礎,“搜狗分身”是搜狗人工智能的核心技術之一,誕生于搜狗“自然交互+知識計算”這一人工智能理念之下,它能通過人臉關鍵點檢測、人臉特征提取、人臉重構、唇語識別、情感遷移等多項前沿技術,并結合語音、圖像等多模態(tài)信息進行建模訓練后,生成與真人無異的AI分身模型,進而幫助人類提高信息表達和傳遞的效率。
得益于前沿技術的加持,AI合成主播前期只需經(jīng)過少量的數(shù)據(jù)訓練,就能呈現(xiàn)與真人相差無幾的播報狀態(tài),同時還支持個性化定制,滿足用戶的不同需求。AI合成主播不僅可以將新聞稿快速地轉變?yōu)椴笠曨l,還能快速學習用戶音色、韻律、情感等多維度特征,妥善處理聲調(diào)起伏、語言風格、情感韻律等,并提供全天候不間斷的播報服務,極大地提高廣電行業(yè)的傳播效率。
隨著“搜狗分身”技術能力的不斷提高,AI主播的定制周期也大為降低,合成效果和穩(wěn)定性也有著顯著提升。僅靠少量用戶真實音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型。本次在新華社兩會報道中驚艷亮相的首個AI合成女主播,正是“搜狗分身”技術持續(xù)復制不同類型、不同特點AI合成主播能力的一個有力體現(xiàn)。
為不同職業(yè)賦能,搜狗分身的未來遠不止于主播
在兩會期間,AI合成女主播的首次登場亮相,即引發(fā)了媒體和網(wǎng)友關于主播行業(yè)的激烈討論,可見當科技融入到生活后所帶來的沖擊感是非同凡響的。宛如科幻大片一般的場景,正在逐步成為現(xiàn)實。和真人主播相比,通過“搜狗分身”技術打造的AI合成主播能夠不知疲倦地工作24小時,同時還掌握多國語言,大大提升了效率、降低了成本。
然而,AI合成主播僅僅只是一個開始。伴隨著人工智能技術的不斷升級,個性化內(nèi)容生產(chǎn)的門檻大為降低,應用范圍愈發(fā)廣泛。未來,“搜狗分身”技術還將應用于娛樂、醫(yī)療、健康、教育、法律、金融等多個領域,通過提供個性化的行業(yè)解決方案,為不同場景展開賦能。根據(jù)不同場景而創(chuàng)造出虛擬教師、虛擬客服、虛擬管家、虛擬醫(yī)生等職業(yè),深度參與到人類的內(nèi)容表達和信息傳遞場景之中,提供服務并發(fā)揮更多價值。屆時,各行各業(yè)都將迎來AI技術下的新一輪變革。
-
AI
+關注
關注
87文章
31536瀏覽量
270346 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240307 -
黑科技
+關注
關注
14文章
127瀏覽量
37450
原文標題:全球首個AI合成女主播上崗,背后有哪些“黑科技”?
文章出處:【微信號:IC-008,微信公眾號:半導體那些事兒】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
Arm 年度技術大會: 預計2025 年底,全球將有超過 1,000 億臺具備 AI 能力的 Arm 設備
![Arm 年度技術大會: 預計2025 年底,<b class='flag-5'>全球</b><b class='flag-5'>將有</b>超過 1,000 億臺具備 <b class='flag-5'>AI</b> 能力的 Arm 設備](https://file1.elecfans.com/web2/M00/0C/2D/wKgZomdAC4uAUydJAACPn-mex-k567.png)
阿里國際推出全球首個B2B AI搜索引擎Accio
全球首個開源AI標準正式發(fā)布
《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得
昆侖萬維發(fā)布全球首個AI流媒體音樂平臺Melodio
阿里云推出首個域名AI大模型應用
plc有三個數(shù)據(jù),在網(wǎng)關中如何整合成一個呢?
如何利用AI進行提升自我呢?
2024 TUYA全球開發(fā)者大會盛大啟幕,Cube AI大模型重磅首發(fā)!
![2024 TUYA<b class='flag-5'>全球</b>開發(fā)者大會盛大啟幕,Cube <b class='flag-5'>AI</b>大模型重磅首發(fā)!](https://file.elecfans.com/web2/M00/40/04/pYYBAGJrTDSAYdI1AAASTiyZjeQ622.jpg)
賦能未來:VOC技術如何引領AI新篇章
工業(yè)物聯(lián)網(wǎng)究竟是什么呢?它又有哪些作用呢?
英偉達AI服務器NVLink版與PCIe版有何區(qū)別?又如何選擇呢?
![英偉達<b class='flag-5'>AI</b>服務器NVLink版與PCIe版有何區(qū)別?又如何選擇<b class='flag-5'>呢</b>?](https://file1.elecfans.com/web2/M00/C4/F1/wKgZomX5BQCAAGCPAAaUZ9psNS4086.jpg)
評論