吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何透徹理解卷積的數(shù)據(jù)原理與機制

新機器視覺 ? 來源:極市平臺 ? 作者:極市平臺 ? 2021-06-16 16:43 ? 次閱讀

作者以拋球?qū)嶒灋槔v解了許多卷積的數(shù)學(xué)原理和機制,并通過卷積來表述卷積神經(jīng)網(wǎng)絡(luò)。文章附有大量圖片解釋,幫助大家更容易理解。

拋球?qū)嶒?-- Ball drop experiment

想象一下,我們把一個球從某個高度落到地面上,它只有一個運動維度。如果你把球落下,然后再從它的落點上方把它落下,球會走一段距離 的可能性有多大?

我們來分析一下: 第一次下落后,它將以概率 落在離起點一個單位的地方,其中是概率分布。現(xiàn)在,在第一次落下之后,我們把球撿起來,從它第一次落地點以上的另一個高度落下。球從新的起點滾動 個單位的概率是 ,如果它是從不同的高度落下的,那么 可能是不同的概率分布。

如果我們把第一次下落的結(jié)果固定下來,使我們知道球走了距離 ,對于球走的總距離 ,第二次下落時走的距離也固定為 ,即 。所以這種情況發(fā)生的概率簡單來說就是 。。

我們用一個具體的離散例子來思考這個問題。我們希望總距離 為 3。如果它第一次滾動,,那么第二次必須滾動 ,才能達到我們的總距離 。這個概率是 。

然而,這并不是我們可以達到總距離3的唯一方法。球可以第一次滾1個單位,第二次滾2個單位。或者第一次滾0個單位,第二次滾3個單位。它可以是任何 和 ,只要他們加起來是 3。

為了求出小球到達總 的總概率,我們不能只考慮到達 的一種可能方式,而是考慮將 分成 和 的所有可能方式,并將每種方式的概率相加。

我們已經(jīng)知道, 的每一種情況的概率簡單來說就是 。所以,將 的每一個解求和,我們可以將總似然表示為。

和 的卷積,在 處被定義為。

如果我們把代入,我們得到。

為了使這一點更加具體,我們可以從球可能落地的位置來考慮。在第一次落地后,它將以概率 落在中間位置 。如果它落在 處,它落在 處的概率為 。

為了得到卷積,我們需要考慮所有的中間位置。

可視化卷積 -- Visualizing Convolutions

假設(shè)一個球落在離原點一定距離 的概率是。那么,它 從 處返回原點的的概率是。

如果我們知道球在第二次落地后落在 處,那么第一次的位置是 的概率是多少?

所以,前一個位置是 的概率是 。

每個中間位置球最終落在 處的概率。我們知道第一個落點把球放到中間位置 的概率是 。我們還知道,如果它落在 處,它在 處的概率是 。

將 的所有可能值相加,我們得到卷積結(jié)果。

通過移動下半部分,當(dāng)分布對齊時,卷積達到峰值。

并且隨著分布之間的交點越來越小而縮小。

下圖,我們能夠直觀地看到三角波與方波函數(shù)的卷積。

759a0278-cab3-11eb-9e57-12bb97331649.jpg

掌握了這個要點,很多概念變得更加直觀。

音頻處理中有時會用到卷積。例如,人們可能會使用一個有兩個尖峰,但其他地方都是零的函數(shù)來創(chuàng)建一個回聲。當(dāng)我們的雙尖峰函數(shù)滑動時,一個尖峰首先擊中一個時間點,將該信號添加到輸出聲音中,之后,另一個尖峰跟隨,添加第二個延遲的副本。

高維卷積--Higher Dimensional Convolutions

卷積不僅僅適用于1維看空間,也適用于高維空間。

回顧開頭的例子,落下的球。現(xiàn)在,當(dāng)它落下時,它的位置不僅在一維中移動,而且在二維中移動。

和前面的卷積一樣。

只是,現(xiàn)在 , , 和 都是向量。更明確地說,

標(biāo)準(zhǔn)定義:

就像一維卷積一樣,我們可以把二維卷積看成是把一個函數(shù)滑動到另一個函數(shù)之上,進行乘法和加法。

卷積神經(jīng)網(wǎng)絡(luò)--Convolutional Neural Networks

那么,卷積與卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系如何呢?

在一個1維卷積層中,輸入 ,輸出 。

從信號與系統(tǒng)的角度來描述,

是輸入信號,是輸出信號, 是系統(tǒng),這個系統(tǒng)由 個神經(jīng)元組成,可以用輸入來描述輸出。

也可以用神經(jīng)網(wǎng)絡(luò)的方式來描述

其中 是輸入, 是權(quán)重。權(quán)重描述了神經(jīng)元與輸入的連接方式。

負(fù)的權(quán)重意味著輸入會抑制神經(jīng)元發(fā)射,而正的權(quán)重則鼓勵它發(fā)射。

權(quán)重是神經(jīng)元的心臟,控制著它的行為。如果說2個神經(jīng)元是相同的,即它們的權(quán)重是相同的。

其中一個常見的應(yīng)用是圖像處理。我們可以把圖像看作是二維函數(shù)。許多重要的圖像變換都是卷積,你用一個非常小的局部函數(shù)(稱為 “內(nèi)核”)對圖像函數(shù)進行卷積。

在上面的演示中,綠色部分類似于我們的 5x5x1 輸入圖像 。在卷積層的第一部分進行卷積操作的元素被稱為Kernel/Filter, 用黃色表示。我們選擇一個3x3x1矩陣作為Kernel。

Kernel 以一定的步伐向右移動,直到它解析出整行的寬度。接著,它以相同的步伐值跳到圖像的開頭(左邊),并重復(fù)這個過程,直到遍歷整個圖像。

在多通道圖像的情況下( 如RGB ),Kernel 的深度與輸入圖像的深度相同。Kernel 與圖片 進行矩陣乘法,然后將所有結(jié)果與偏置相加,得到一個單通道卷積特征輸出。

卷積操作的目的是從輸入圖像中提取高級特征,如邊緣。傳統(tǒng)上,卷積層可以捕捉低級特征,如邊緣、顏色、梯度方向等。隨著層數(shù)的增加,架構(gòu)也可以捕捉高階特征,讓我們的神經(jīng)網(wǎng)絡(luò)對圖像有更深刻的理解。

該卷積有兩種結(jié)果--一種是卷積特征與輸入相比維度減少,有效填充(Valide Padding)。另一種是維度增加或保持不變,相同填充(Same Padding)。

當(dāng)我們將5x5x1的圖像填充為6x6x1的圖像,然后在其上應(yīng)用3x3x1的核,我們發(fā)現(xiàn)卷積矩陣變成了5x5x1的尺寸。因此,我們將其命名為--相同填充(Same Padding)。

另一方面,如果我們在沒有填充的情況下執(zhí)行同樣的操作,我們將得到一個具有內(nèi)核(3x3x1)本身尺寸的矩陣--有效填充(Valide Padding)。

池化層 -- Pooling Layer

與卷積層類似,Pooling層負(fù)責(zé)減少卷積特征的空間大小。這是為了通過降低維度來降低處理數(shù)據(jù)所需的計算能力。此外,它還有助于提取旋轉(zhuǎn)和位置不變的主導(dǎo)特征,從而保持模型的有效訓(xùn)練過程。下圖表示在5x5卷積特征上的3x3池化。

有兩種類型的池化。最大池化和平均池化。最大池化(Max Pooling)返回的是Kernel覆蓋的圖像部分的最大值。另一方面,平均池化(Average Pooling)返回Kernel覆蓋的圖像部分的所有值的平均值。

Max Pooling也是一種噪聲抑制器。它完全丟棄了嘈雜的激活,并在降低維度的同時進行去噪。另一方面,Average Pooling只是作為噪聲抑制機制進行維度降低。因此,我們可以說Max Pooling的性能比Average Pooling好很多。

卷積層和池化層,共同構(gòu)成了卷積神經(jīng)網(wǎng)絡(luò)的第層。根據(jù)圖像的復(fù)雜程度,可以增加這些層的數(shù)量,以便進一步捕捉低層次的細(xì)節(jié),但代價是增加計算能力。

在經(jīng)歷了上述過程后,我們已經(jīng)成功地使模型理解了特征。接下來,我們要將最終的輸出結(jié)果進行扁平化處理,并將其饋送到普通的神經(jīng)網(wǎng)絡(luò)中,以達到分類的目的。

全連接層(FC層) —- Fully Connected Layer (FC Layer)

全連接層正在學(xué)習(xí)該空間中可能的非線性函數(shù)。

現(xiàn)在,我們已經(jīng)將輸入圖像轉(zhuǎn)換為適合多級感知器 (Multi-Level Perceptron) 的形式,我們將把圖像扁平化(Flatten layer)為列向量。扁平化的輸出被送入前饋神經(jīng)網(wǎng)絡(luò),并在每次訓(xùn)練迭代中應(yīng)用反向傳播。在一系列的紀(jì)元中,該模型能夠區(qū)分圖像中的主導(dǎo)特征和某些低級特征,并使用Softmax分類方法對其進行分類。

總結(jié) -- Conclusion

我們在這篇博文中介紹了很多數(shù)學(xué)機制,但我們獲得的東西可能并不明顯。卷積顯然是概率論和計算機圖形學(xué)中的一個有用工具,但是用卷積來表述卷積神經(jīng)網(wǎng)絡(luò),我們獲得了什么?

第一個好處是,我們有了一些非常強大的語言來描述神經(jīng)網(wǎng)絡(luò)的層。卷積大大簡化了繁瑣的計算工作。

其次,卷積非常容易實現(xiàn)。現(xiàn)存的許多庫都提供了高效的卷積方法。

此外,卷積看起來是一個 操作,但使用一些相當(dāng)深刻的數(shù)學(xué)見解,可以創(chuàng)建一個 的實現(xiàn)。

Tips:

我們想知道球第一次滾動 單位,第二次滾動 單位的概率。所以 。

卷積滿足交換律,即 。

卷積滿足結(jié)合律的,即,

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 卷積
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    18548
  • 離散
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    17764
  • 噪聲抑制器
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7256

原文標(biāo)題:如何透徹理解卷積的數(shù)據(jù)原理與機制:從拋球?qū)嶒炚f起

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    取特征的強大工具,例如識別音頻信號或圖像信號中的復(fù)雜模式就是其應(yīng)用之一。 1、什么是卷積神經(jīng)網(wǎng)絡(luò)? 神經(jīng)網(wǎng)絡(luò)是一種由神經(jīng)元組成的系統(tǒng)或結(jié)構(gòu),它使AI能夠更好地理解數(shù)據(jù),進而解決復(fù)雜問題。雖然神經(jīng)網(wǎng)絡(luò)有
    發(fā)表于 10-24 13:56

    高斯濾波的卷積核怎么確定

    高斯濾波的卷積核確定主要依賴于高斯函數(shù)的特性以及圖像處理的具體需求。以下是確定高斯濾波卷積核的幾個關(guān)鍵步驟: 一、確定卷積核的大小 卷積核形狀 :高斯濾波的
    的頭像 發(fā)表于 09-29 09:29 ?765次閱讀

    深度學(xué)習(xí)中反卷積的原理和應(yīng)用

    像分割、圖像重建和生成對抗網(wǎng)絡(luò)(GANs)等,反卷積展現(xiàn)出了其獨特的優(yōu)勢和廣泛的應(yīng)用前景。本文將詳細(xì)探討深度學(xué)習(xí)中的反卷積技術(shù),包括其定義、原理、實現(xiàn)方式、應(yīng)用場景以及與其他上采樣方法的比較,以期為讀者提供一個全面而深入的理解
    的頭像 發(fā)表于 07-14 10:22 ?2349次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)通常被用來處理具有顯著空間層次結(jié)構(gòu)的數(shù)據(jù),特別是圖像和視頻數(shù)據(jù)。它們通過模擬人類視覺處理機制中的某
    的頭像 發(fā)表于 07-11 14:51 ?897次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的卷積操作

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)中的卷積操作是其核心組成部分,對于圖像識別、語音識別、自然語言處理等領(lǐng)域具有重要意義。本文將從卷積操作的基本概念、原理、過程、特點及其在CNN中的
    的頭像 發(fā)表于 07-04 16:10 ?1629次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)概述及Python實現(xiàn)

    學(xué)習(xí)(deep learning)的代表算法之一。CNN通過模擬生物的視知覺機制,能夠有效地處理具有網(wǎng)格狀拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù),如圖像、聲音等,并在計算機視覺、自然語言處理等領(lǐng)域取得了顯著成果。
    的頭像 發(fā)表于 07-04 14:22 ?549次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)示例

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,主要用于處理具有網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),如圖像。CNN通過卷積層自動提取圖像特征,然后通過全連接層進行
    的頭像 發(fā)表于 07-03 10:51 ?517次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)原理

    、訓(xùn)練過程以及應(yīng)用場景。 卷積神經(jīng)網(wǎng)絡(luò)的基本原理 1.1 卷積操作 卷積神經(jīng)網(wǎng)絡(luò)的核心是卷積操作。卷積操作是一種數(shù)學(xué)運算,用于提取輸入
    的頭像 發(fā)表于 07-03 10:49 ?658次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    ,包括基本原理、常見架構(gòu)、優(yōu)化策略、應(yīng)用場景等。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本原理 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),其核心思想是通過卷積層提取輸入數(shù)據(jù)的局部特征,并通過池化層降低特征的空間
    的頭像 發(fā)表于 07-03 09:40 ?555次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)計算過程和步驟

    卷積層(Convolutional Layer) 卷積層是卷積神經(jīng)網(wǎng)絡(luò)的核心組成部分,它通過卷積操作提取輸入數(shù)據(jù)的特征。
    的頭像 發(fā)表于 07-03 09:36 ?728次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的組成部分有哪些

    卷積層、池化層、激活函數(shù)、全連接層、損失函數(shù)、優(yōu)化算法等,并探討它們在CNN中的作用和應(yīng)用。 卷積層(Convolutional Layer) 卷積層是CNN中的核心組成部分,它通過卷積
    的頭像 發(fā)表于 07-03 09:31 ?1225次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    、訓(xùn)練過程以及應(yīng)用場景。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋深度學(xué)習(xí)模型,其核心思想是利用卷積操作提取輸入
    的頭像 發(fā)表于 07-03 09:15 ?521次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實現(xiàn)

    核心思想是通過卷積操作提取輸入數(shù)據(jù)的特征。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享和局部連接的特點,這使得其在處理圖像等高維數(shù)據(jù)時具有更高的效率和更好的性能。
    的頭像 發(fā)表于 07-02 16:47 ?728次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)cnn模型有哪些

    (Convolutional Layer) 卷積層是CNN的核心,用于提取圖像的局部特征。卷積操作通過滑動窗口(濾波器或卷積核)在輸入數(shù)據(jù)上進行計算,生成特征圖(Feature Map
    的頭像 發(fā)表于 07-02 15:24 ?797次閱讀

    verilog實現(xiàn)卷積運算

    在Verilog中實現(xiàn)卷積運算,你可以使用以下示例代碼。這里假設(shè)輸入數(shù)據(jù)是有符號8位數(shù),輸出數(shù)據(jù)也是有符號8位數(shù)。卷積在數(shù)字信號處理中通常指的是兩個序列的逐元素乘積的和,也就是點乘。
    發(fā)表于 03-26 07:51
    金都百家乐的玩法技巧和规则| 百家乐辅助分析软件| 海王星百家乐官网技巧| 深圳百家乐官网的玩法技巧和规则 | 决胜德州扑克刷金币| 册亨县| 百家乐官网玩法秘决| 菲律宾百家乐官网娱乐平台| 黄金城百家乐游戏| 大都会百家乐的玩法技巧和规则| 棋牌游戏开发商| 新葡京百家乐官网现金| 真人百家乐官网新开户送彩金| 金都百家乐官网现金网| 百家乐官网在线娱乐网| 百家乐三路秘诀| 德州扑克比大小| 百家乐官网网上投注网站| 博发百家乐官网的玩法技巧和规则 | 东京太阳城王子酒店| 百家乐官网2万| 百家乐三珠连跳打法| 青朋棋牌游戏| 成人百家乐官网的玩法技巧和规则| 全景网百家乐的玩法技巧和规则 | 百家乐开户优惠多的平台是哪家 | 威尼斯人娱乐城首存优惠| 百家乐官网2珠路投注法| 百家乐视频台球下载| 尊龙备用网址| 百家乐官网娱乐礼金| 威尼斯人娱乐城演唱会| 澳门百家乐官网娱乐城信誉如何| 百家乐电子路单谁| 百家乐官网软件购买| 皇冠百家乐客户端皇冠| 励骏会百家乐官网的玩法技巧和规则 | 百家乐官网太阳城小郭| 线上百家乐官网怎么玩| 淘金盈| 百家乐在线小游戏|