在OpenAI宣布即將發(fā)布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——Genie 2。這款模型能夠生成各種可控制動(dòng)作、可玩的3D環(huán)境,為用戶帶來全新的交互式體驗(yàn)。
據(jù)了解,Genie 2是一個(gè)自回歸潛在擴(kuò)散模型,它基于大型視頻數(shù)據(jù)集進(jìn)行訓(xùn)練。通過自動(dòng)編碼器,視頻中的潛在幀被傳遞到大型Transformer動(dòng)力學(xué)模型中。該模型采用與大語言模型類似的因果掩碼進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)了對3D環(huán)境的精準(zhǔn)生成和控制。
令人驚嘆的是,用戶只需給Genie 2一張?zhí)崾緢D像,并輸入相應(yīng)的文本提示,它就能生成一個(gè)對應(yīng)的交互式虛擬世界。在這個(gè)由AI生成的3D游戲世界里,無論是人類還是AI agent,都可以通過鍵盤和鼠標(biāo)進(jìn)行探索和互動(dòng),享受前所未有的游戲體驗(yàn)。
Genie 2的發(fā)布標(biāo)志著Google DeepMind在AI生成3D環(huán)境技術(shù)方面取得了重大突破。未來,這一技術(shù)有望在游戲開發(fā)、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等領(lǐng)域得到廣泛應(yīng)用,為用戶帶來更加豐富、多樣的交互體驗(yàn)。同時(shí),這也為AI技術(shù)的發(fā)展注入了新的活力,推動(dòng)了AI技術(shù)在各個(gè)領(lǐng)域的創(chuàng)新和應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
SciChart 3D for WPF 是一個(gè)實(shí)時(shí)、高性能的 WPF 3D 圖表庫,專為金融、醫(yī)療和科學(xué)應(yīng)用程序而設(shè)計(jì)。非常適合需要極致性能和豐富的交互式 3D 圖表的項(xiàng)目。 使用我們
發(fā)表于 01-23 13:49
?118次閱讀
繁瑣且耗時(shí)。
現(xiàn)在,通過在您網(wǎng)站上的交互式3D預(yù)覽中顯示關(guān)鍵尺寸,工程師可以在下載和購買前配置他們需要的零件,并可三維預(yù)覽其模型,從而讓他們可以在您網(wǎng)站上直接生成可查看和可操作的準(zhǔn)確的數(shù)字化產(chǎn)品。從
發(fā)表于 01-20 16:09
在當(dāng)今數(shù)字化時(shí)代,3D技術(shù)的應(yīng)用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設(shè)計(jì)、虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)、游戲等眾多領(lǐng)域。而3D文件格式作為3D技術(shù)的核心組成部分,對于實(shí)現(xiàn)
發(fā)表于 09-26 18:14
?1605次閱讀
? 在過去幾十年里,動(dòng)作捕捉(MoCap)技術(shù)經(jīng)歷了顯著的發(fā)展,廣泛被應(yīng)用于電影、游戲、虛擬現(xiàn)實(shí)、醫(yī)療等多個(gè)領(lǐng)域。近期,奧比中光合作客戶Moverse使用Orbbec Femto系列3D相機(jī),打造
發(fā)表于 06-25 16:37
?1141次閱讀
隨著科技的快速發(fā)展,人類對于視覺體驗(yàn)的追求也在不斷攀升。從平面的2D圖像到立體的3D影像,我們一直在探索如何讓虛擬世界更加逼真。如今,英倫科技憑借其創(chuàng)新實(shí)力,推出了一款革命性的顯示設(shè)備
發(fā)表于 05-28 11:17
?415次閱讀
隨著科技的飛速發(fā)展,虛擬空間已成為元宇宙的重要呈現(xiàn)方式。從游戲到工業(yè)設(shè)計(jì),從電子商務(wù)到文旅體驗(yàn),3D相關(guān)技術(shù)在虛擬空間中發(fā)揮著舉足輕重的作用,決定著用戶們能否真正能體會(huì)到VR的沉浸式體
發(fā)表于 04-29 09:36
?1596次閱讀
4月9日,奧比中光與戰(zhàn)略合作伙伴創(chuàng)想三維聯(lián)合打造的高精度3D掃描儀CR-Scan Otter、CR-Scan Raptor正式發(fā)布。
發(fā)表于 04-12 09:06
?762次閱讀
怪獸智能數(shù)字人,實(shí)時(shí)交互數(shù)字人直播系統(tǒng),3D超寫實(shí)虛擬形象直播 隨著科技的不斷進(jìn)步,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)逐漸進(jìn)入人們的日常生活。而在這個(gè)數(shù)字化時(shí)代,人們對于直播內(nèi)容的需求也越來越高。與此同
發(fā)表于 03-05 09:08
?697次閱讀
谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬
發(fā)表于 03-04 14:02
?816次閱讀
谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動(dòng)方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些創(chuàng)意迅速轉(zhuǎn)化為一個(gè)可互動(dòng)和玩耍的
發(fā)表于 02-28 18:25
?1761次閱讀
谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個(gè)可玩的、交互式的虛擬
發(fā)表于 02-28 17:41
?894次閱讀
大家都喜歡玩游戲吧?因?yàn)橛螒蜃畲蟮奈κ亲屛覀兲颖墁F(xiàn)實(shí)、幻想一個(gè)遠(yuǎn)離我們眼前現(xiàn)實(shí)的世界,掌控這個(gè)虛擬的現(xiàn)實(shí)世界?,F(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。
發(fā)表于 02-28 10:45
?979次閱讀
近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑唵蔚奈谋咎崾?、草圖或初步想法迅速轉(zhuǎn)化為一個(gè)可以互動(dòng)和游戲的虛擬世界。這一突破性的技術(shù)無疑將改變?nèi)藗儎?chuàng)建和體驗(yàn)虛擬
發(fā)表于 02-28 10:05
?815次閱讀
DeepMind指出,Genie有能力根據(jù)最新的文生圖大模型生成初始幀,再借助Genie的能力賦予這些圖像更深層次的含義。Genie作為一個(gè)包含110億參數(shù)的基礎(chǔ)
發(fā)表于 02-28 10:02
?552次閱讀
據(jù)報(bào)道,谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布了AI模型Genie,此模型擁有多達(dá)110億個(gè)參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場景。
發(fā)表于 02-27 14:53
?843次閱讀
評論