4 月 19 日報道,近期微軟亞洲研究院推出了名為 VASA-1 的創(chuàng)新模型,針對靜態(tài)肖像照片和錄音音頻片段,其能實現(xiàn)圖片中角色的自動化配音。
該模型,尤其擅長展現(xiàn)逼真的面部表情及各類情緒,且嘴唇動作高度擬真。然而,盡管研究員坦承目前仍有不足之處,如無法精準(zhǔn)處理頭發(fā)等纖維質(zhì)元素,但相較于其他類似模型,VASA-1 的表現(xiàn)已屬優(yōu)異。
此外,研究員還透露,VASA-1 在離線批量處理模式下,可生成分辨率高達(dá) 512*512 的動態(tài)短片,幀速率為 45fps;在線直播模式下,幀速率也可達(dá)到 40fps,延遲時間僅為 170ms。而完成這一切,只需一臺搭載 NVIDIA RTX 4090 顯卡的計算機即可。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
近日,浪潮信息與北京智源人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構(gòu)建大模型多元算力開源創(chuàng)新生態(tài)。 此次合作旨在提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻
發(fā)表于 12-31 11:49
?295次閱讀
12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智源人工智能研究院(以下簡稱“智源研究院”)正式簽署戰(zhàn)略合作協(xié)議,雙方將面向多元AI芯片領(lǐng)域開展算子庫優(yōu)化與適配、編譯器與工具鏈
發(fā)表于 12-26 17:06
?220次閱讀
近日,浪潮信息與智源研究院達(dá)成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元算力開源創(chuàng)新生態(tài),提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻。目前,智源Triton算子庫Fla
發(fā)表于 12-26 10:25
?223次閱讀
近日,微軟在東京正式啟用了其日本首個研究基地——微軟亞洲研究院東京分院。作為微軟在全球技術(shù)實驗室
發(fā)表于 11-19 16:26
?307次閱讀
近日,天馬新型顯示技術(shù)研究院(廈門)有限公司、上海天馬微電子有限公司與武進(jìn)南大未來技術(shù)創(chuàng)新研究院就Micro LED業(yè)務(wù)、非顯傳感業(yè)務(wù)達(dá)成戰(zhàn)略合作。
發(fā)表于 11-14 11:53
?440次閱讀
藍(lán)思科技近日宣布,將新增一個重點研發(fā)機構(gòu),即藍(lán)思昆山創(chuàng)新研究院,目前正在緊鑼密鼓地建設(shè)中。該研究院的成立,標(biāo)志著藍(lán)思科技在研發(fā)領(lǐng)域的進(jìn)一步拓展和深化。
發(fā)表于 10-28 16:25
?394次閱讀
近日,中國電信人工智能研究院宣布了一項重大技術(shù)突破:成功完成國內(nèi)首個基于全國產(chǎn)化萬卡集群訓(xùn)練的萬億參數(shù)大模型。
發(fā)表于 09-30 16:41
?1773次閱讀
近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統(tǒng)一系統(tǒng)計算架構(gòu)MUSA,雙方在短短一周多的時間
發(fā)表于 08-02 11:06
?974次閱讀
近日,中國電信人工智能研究院(TeleAI)攜手北京智源人工智能研究院,共同推出了全球首個單體稠密萬億參數(shù)語義模型——Tele-FLM-1T,這一里程碑式的成就標(biāo)志著中國電信在人工智能
發(fā)表于 06-20 10:50
?707次閱讀
中國電信人工智能研究院(TeleAI)近日發(fā)布了一項引領(lǐng)業(yè)界的語音識別技術(shù)——星辰超多方言語音識別大模型。這一模型突破性地支持30種方言的自
發(fā)表于 05-28 09:14
?622次閱讀
長沙北斗研究院總部基地正式奠基 日前長沙北斗研究院總部基地正式奠基,項目由長沙北斗研究院牽頭建設(shè);項目又名“北斗足跡”。項目一期預(yù)計2025年年底前建成投用。 據(jù)悉,長沙北斗研究院總部
發(fā)表于 05-16 12:49
?1267次閱讀
2024年4月,SAP d-com China開發(fā)者大會成功舉辦。會上,SAP中國研究院創(chuàng)新生態(tài)2.0專家委員會(以下簡稱“專委會”)成員單位上海浦東軟件園獲得SAP中國研究院 “Bamboo Award” 2023獎項,
發(fā)表于 05-10 10:20
?475次閱讀
近日,航天宏圖信息技術(shù)股份有限公司(以下簡稱“航天宏圖”)與長沙天儀空間科技研究院有限公司(以下簡稱“天儀研究院”)正式簽署戰(zhàn)略合作框架協(xié)議。
發(fā)表于 04-23 17:11
?647次閱讀
胡潤研究院從2017年開始追蹤記錄獨角獸企業(yè),這是第六次發(fā)布全球獨角獸榜。榜單顯示,截至2024年1月1日,全球共有1453家獨角獸企業(yè),總價值4.6萬億美元,分
發(fā)表于 04-12 08:22
?525次閱讀
近日,浙江圖靈算力研究院生態(tài)伙伴聯(lián)誼會在杭州舉行,知存科技作為研究院生態(tài)企業(yè)之一,與賽迪研究院、中科院計算所、自動化所和中國RISC-V聯(lián)盟
發(fā)表于 03-06 14:02
?899次閱讀
評論