吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大腦視覺信號被Stable Diffusion復現圖像!“人類的謀略和謊言不存在了”

傳感器技術 ? 來源:量子位 ? 2023-03-08 10:21 ? 次閱讀

“現在Stable Diffusion已經能重建大腦視覺信號了!”

就在昨晚,一個聽起來細思極恐的“AI讀腦術”研究,在網上掀起軒然大波:

396fcd74-bd22-11ed-bfe3-dac502259ad0.png

這項研究聲稱,只需用fMRI(功能磁共振成像技術,相比sMRI更關注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號,AI就能重建出我們看到的圖像!

3a6ce5b8-bd22-11ed-bfe3-dac502259ad0.png

例如這是一系列人眼看到的圖像,包括戴著蝴蝶結的小熊、飛機和白色鐘樓:

3b4a3f44-bd22-11ed-bfe3-dac502259ad0.png

AI看了眼人腦信號后,立馬就給出這樣的結果,屬實把該抓的重點全都抓住了:

3b846890-bd22-11ed-bfe3-dac502259ad0.gif

再發展一步,這不就約等于哈利波特里的讀心術了嗎??

3d33610a-bd22-11ed-bfe3-dac502259ad0.png

更有網友感到驚嘆:如果說ChatGPT開放API是件大事,那這簡直稱得上瘋狂。

3d4fb9ae-bd22-11ed-bfe3-dac502259ad0.png

所以,這究竟是怎么一回事?

用Stable Diffusion可視化人腦信號

這項研究來自日本大阪大學,目前已經被CVPR 2023收錄:

3d8c1be2-bd22-11ed-bfe3-dac502259ad0.png

研究希望能從人類大腦活動中,重建高保真的真實感圖像,來理解大腦、并解讀計算機視覺模型和人類視覺系統之間的聯系。

要知道,此前雖然有不少腦機接口研究,致力于從人類大腦活動中讀取并重建信號,如意念打字等。

然而,從人類大腦活動中重建視覺信號——具有真實感的圖像,仍然挑戰極大。

例如這是此前UC伯克利做過的一項類似研究,復現一張人眼看到的飛機片段,但計算機重建出來的圖像卻幾乎看不出飛機的特征:

3db61ed8-bd22-11ed-bfe3-dac502259ad0.png

△圖源UC伯克利研究Reconstructing Visual Experiences from Brain Activity Evoked by Natural Movies

這次,研究人員重建信號選用的AI模型,是這一年多在圖像生成領域地位飛升的擴散模型。

當然,更準確地說是基于潛在擴散模型(LDM)——Stable Diffusion。

整體研究的思路,則是基于Stable Diffusion,打造一種以人腦活動信號為條件的去噪過程的可視化技術。

它不需要在復雜的深度學習模型上進行訓練或做精細的微調,只需要做好fMRI(功能磁共振成像技術)成像到Stable Diffusion中潛在表征的簡單線性映射關系就行。

它的概覽框架是這樣的,看起來也非常簡單:

僅由1個圖像編碼器、1個圖像解碼器,外加1個語義解碼器組成。

3e174c12-bd22-11ed-bfe3-dac502259ad0.png

具體怎么work?

如下圖所示,第一部分為本研究用到的LDM示意圖。

其中ε代表圖像編碼器,D代表圖像解碼器,而τ是一個文本編碼器(CLIP)。

3e83cf22-bd22-11ed-bfe3-dac502259ad0.png

重點是解碼分析,如下圖所示,模型依次從大腦早期(藍色)和較高(黃色)視覺皮層內的fMRI信號中,解碼出重建圖像(z)和相關文本c的潛在表征。

然后將這些潛在表征當作輸入,就可以得到模型最終復現出來的圖像Xzc。

3ec8219a-bd22-11ed-bfe3-dac502259ad0.png

最后還沒有完,如編碼分析示意圖,作者還構建了一個編碼模型,用來預測LDM不同組件(包括圖像z、文本c和zc)所對應的fMRI信號,它可以用來理解Stable Diffusion的內部過程。

3f2ab3b4-bd22-11ed-bfe3-dac502259ad0.png

可以看到,采用了zc的編碼模型在大腦后部視覺皮層產生的預測精確度是最高的。(zc是與c進行交叉注意的反向擴散后,z再添加噪聲的潛在表征)

3f8f8604-bd22-11ed-bfe3-dac502259ad0.png

相比其它兩者,它生成的圖像既具有高語義保真度,分辨率也很高。

3ffe05ac-bd22-11ed-bfe3-dac502259ad0.png

還有用GAN重建人臉圖像的

看完這項研究,已經有網友想到了細思極恐的東西:

這個AI雖然只是復制了“眼睛”所看到的東西。

但是否會有一天,AI能直接從人腦的思維、甚至是記憶中重建出圖像或文字?

42529750-bd22-11ed-bfe3-dac502259ad0.png

“語言的用處不再存在了”

42b9b700-bd22-11ed-bfe3-dac502259ad0.png

于是有網友進一步想到,如果能讀取記憶的話,那么目擊證人的證詞似乎也會變得更可靠了:

42e4640a-bd22-11ed-bfe3-dac502259ad0.png

還別說,就在去年真有一項研究基于GAN,通過fMRI收集到的大腦信號重建看到的人臉圖像:

4310ef5c-bd22-11ed-bfe3-dac502259ad0.png

不過,重建出來的效果似乎不怎么樣……

43542696-bd22-11ed-bfe3-dac502259ad0.png

顯然,在人臉這種比較精細的圖像生成上,AI“讀腦術”還有很長一段路要走。

對于這種大腦信號重建的研究,也有網友提出了質疑。

例如,是否只是AI從訓練數據集中提取出了相似的數據?

438fd8ee-bd22-11ed-bfe3-dac502259ad0.png

對此有網友回復表示,論文中的訓練數據集和測試集是分開的:

43e489e8-bd22-11ed-bfe3-dac502259ad0.png

作者們也在項目主頁中表示,代碼很快會開源。可以先期待一下~

44435f54-bd22-11ed-bfe3-dac502259ad0.png

作者介紹

本研究僅兩位作者。

一位是2021年才剛剛成為大阪大學助理教授的Yu Takagi,他主要從事計算神經科學和人工智能的交叉研究。

最近,他同時在牛津大學人腦活動中心和東京大學心理學系利用機器學習技術,來研究復雜決策任務中的動態計算。

另一位是大阪大學教授Shinji Nishimoto,他也是日本腦信息通信融合研究中心的首席研究員。

研究方向為定量理解大腦中的視覺和認知處理,谷歌學術引用3000+次。

那么,你覺得這波AI重建圖像的效果如何?

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270330
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49220
  • 可視化
    +關注

    關注

    1

    文章

    1200

    瀏覽量

    21034
  • 深度學習
    +關注

    關注

    73

    文章

    5513

    瀏覽量

    121548

原文標題:大腦視覺信號被Stable Diffusion復現圖像!“人類的謀略和謊言不存在了” | CVPR2023

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    將兩片TLK3101之間用光收發模塊通過光纖互聯,TLK3101和光收發模塊之間的接口匹配不存在問題,為什么?

    我們將兩片 TLK 3101之間用光收發模塊通過光纖互聯,TLK 3101和光收發模塊之間的接口匹配不存在問題,光功率都在正常的范圍之內 ,但在實驗室測試中經常出現TLK 3101幀同步丟失
    發表于 02-05 07:22

    對于低能注入(BR 2K),四點探針測量RS,為什么新針比老針的RS低?而高能注入RS不存在該情況呢

    對于低能注入(BR 2K),四點探針測量RS,為什么新針比老針的RS低?而高能注入RS不存在該情況呢
    發表于 12-20 23:05

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?168次閱讀
    如何開啟<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> WebUI模型推理部署

    DS90UB960Q1接四路攝像頭視頻的話,可以同時顯示的不存在切換的關系吧?

    我想請問下關于DS90UB960Q1 四路攝像頭配置問題: 1.這顆是HUB,接四路攝像頭視頻的話,可以同時顯示的不存在切換的關系吧? 2.同時顯示四種不同的畫面,請問是使用非重復模式還是重復模式呢?
    發表于 12-11 08:09

    示波器的波形存儲與復現,再也不怕瞬時信號抓不住了

    示波器和虛擬USB示波器來進行。Chrent臺式示波器的波形存儲與復現使用信號源模擬一個信號。通過BNC線將這個信號連接到示波器上。在示
    的頭像 發表于 09-05 08:06 ?2410次閱讀
    示波器的波形存儲與<b class='flag-5'>復現</b>,再也不怕瞬時<b class='flag-5'>信號</b>抓不住了

    使用lm2904設計電壓跟隨電路,在大電流流過地線的時候存在幾十mv的電勢差,為什么?

    你好,請問使用lm2904設計電壓跟隨電路,在設計PCB板時沒有注意到,使得供電電壓的地與運放輸出信號的地,在大電流流過地線的時候存在幾十mv的電勢差,不知道這是怎么回事?當我把lm2904換為同封裝形式的OPA2172又不存在
    發表于 08-23 07:30

    什么情況諾頓等效電路不存在

    諾頓等效電路是電路分析中常用的一種方法,它將一個線性二端網絡等效為一個電流源和一個電阻的串聯組合。然而,在某些情況下,諾頓等效電路可能不存在。 非線性電路 諾頓等效電路適用于線性電路,即電路元件
    的頭像 發表于 08-07 09:16 ?692次閱讀

    什么是機器視覺opencv?它有哪些優勢?

    Vision Library)是一個開源的計算機視覺庫,提供大量的圖像處理和計算機視覺算法,廣泛應用于機器視覺領域。 機器
    的頭像 發表于 07-16 10:33 ?901次閱讀

    計算機視覺圖像處理的區別和聯系

    數據的過程。計算機視覺的目標是使計算機能夠像人類一樣“看到”和理解圖像或視頻內容。 1.2 圖像處理 圖像處理,也稱為數字
    的頭像 發表于 07-09 09:16 ?1459次閱讀

    如何修改menuconfig中不存在的nimble參數?

    我想修改一些 menuconfig 中不存在的 nimble 參數,該怎么做才能避免直接修改 components/bt/host/nimble/port/include
    發表于 06-17 08:22

    可以編譯運行的工程代碼中不存在.ioc文件有辦法生產.ioc嗎?

    可以編譯運行的工程代碼中不存在.ioc文件,有辦法生產.ioc嗎?
    發表于 03-26 08:00

    UL Procyon AI 發布圖像生成基準測試,基于Stable Diffusion

    UL去年發布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載,用以保證各支持硬件間公平、可比的性能表現。
    的頭像 發表于 03-25 16:16 ?960次閱讀

    韓國科研團隊發布新型AI圖像生成模型KOALA,大幅優化硬件需求

    由此模型的核心在于其運用了“知識蒸餾”(knowledge distillation)技術,這使得開源圖像生成工具Stable Diffusion XL可大幅縮小其規模。原Stable
    的頭像 發表于 03-01 14:10 ?697次閱讀

    機器視覺圖像采集卡:關鍵的圖像處理設備

    機器視覺圖像采集卡的工作原理。機器視覺圖像采集卡通常由模擬-數字轉換器(ADC)、數字信號處理器(DSP)和接口電路等組成。當光線照射到傳感
    的頭像 發表于 02-22 16:23 ?563次閱讀
    機器<b class='flag-5'>視覺</b><b class='flag-5'>圖像</b>采集卡:關鍵的<b class='flag-5'>圖像</b>處理設備

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stab
    的頭像 發表于 02-19 16:03 ?995次閱讀
    Stability AI試圖通過新的<b class='flag-5'>圖像</b>生成人工智能模型保持領先地位
    百家乐程序软件| 娱乐城注册送现金| 百家乐事电影| 真人百家乐官网免费送钱| 百家乐官网游戏规测| 鼎盛娱乐城开户| 大发888娱乐城游戏下载| 网络百家乐打揽| 现场百家乐平台源码| 中国百家乐官网的玩法技巧和规则 | 百家乐官网庄6点| 澳门美高梅| 大发888官方下载 银行| 888百家乐的玩法技巧和规则| 15人百家乐桌布| 澳门百家乐赢钱秘诀| 百家乐官网群shozo| 百家乐官网长龙技巧| AG百家乐官网大转轮| 百家乐官网两边| 任你博百家乐官网现金网| 林甸县| 泰州市| 百家乐官网路单用处| 卓资县| 壶关县| 网上百家乐官网真实度| 阳山县| 娱乐城注册送现金| 至棒娱乐备用| 郓城县| 百家乐官网视频游戏大厅| 百家乐官网游戏的玩法| 百家乐官网翻天粤语版qvod| 百家乐官网太阳城娱乐城| 免费下百家乐官网赌博软件| 百家乐官网哪条路准| 天天百家乐官网的玩法技巧和规则| 澳门百家乐官网论坛及玩法| 百家乐代理每周返佣| 百家乐游戏如何玩|