吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

Dbwd_Imgtec ? 來源:fqj ? 2019-05-10 08:48 ? 次閱讀

本文將討論:循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks ,以下簡稱RNN),它廣泛的用于自然語言處理中的語音識別,手寫書別以及機器翻譯等領域。

1. RNN概述

在前面講到的DNN和CNN中,訓練樣本的輸入和輸出是比較的確定的。但是有一類問題DNN和CNN不好解決,就是訓練樣本輸入是連續(xù)的序列,且序列的長短不一,比如基于時間的序列:一段段連續(xù)的語音,一段段連續(xù)的手寫文字。這些序列比較長,且長度不一,比較難直接的拆分成一個個獨立的樣本來通過DNN/CNN進行訓練。

而對于這類問題,RNN則比較的擅長。那么RNN是怎么做到的呢?RNN假設我們的樣本是基于序列的。比如是從序列索引 1 到序列索引 T 的。對于這其中的任意序列索引號 t,它對應的輸入是對應的樣本序列中的。而模型在序列索引號 t 位置的隱藏狀態(tài),則由共同決定。在任意序列索引號 t,我們也有對應的模型預測輸出。通過預測輸出和訓練序列真實輸出,以及損失函數(shù),我們就可以用DNN類似的方法來訓練模型,接著用來預測測試序列中的一些位置的輸出。

下面我們來看看RNN的模型。

2. RNN模型

RNN模型有比較多的變種,這里介紹最主流的RNN模型結構如下:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

上圖中左邊是RNN模型沒有按時間展開的圖,如果按時間序列展開,則是上圖中的右邊部分。我們重點觀察右邊部分的圖。

這幅圖描述了在序列索引號t附近RNN的模型。其中:

1)代表在序列索引號 t?1 和 t+1 時訓練樣本的輸入。

2)

3)

4)

5)代表在序列索引號 t 時訓練樣本序列的真實輸出。

6)U,W,V這三個矩陣是我們的模型的線性關系參數(shù),它在整個RNN網(wǎng)絡中是共享的,這點和DNN很不相同。 也正因為是共享了,它體現(xiàn)了RNN的模型的“循環(huán)反饋”的思想。

3. RNN前向傳播算法

有了上面的模型,RNN的前向傳播算法就很容易得到了。

對于任意一個序列索引號t,我們隱藏狀態(tài)

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

其中 σ 為RNN的激活函數(shù),一般為 tanh, b為線性關系的偏倚。

序列索引號 t 時模型的輸出

?+ c

在最終在序列索引號 t 時我們的預測輸出為:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

通常由于RNN是識別類的分類模型,所以上面這個激活函數(shù)一般是softmax。

通過損失函數(shù)

4. RNN反向傳播算法推導

有了RNN前向傳播算法的基礎,就容易推導出RNN反向傳播算法的流程了。RNN反向傳播算法的思路和DNN是一樣的,即通過梯度下降法一輪輪的迭代,得到合適的RNN模型參數(shù) U,W,V,b,c 。由于我們是基于時間反向傳播,所以RNN的反向傳播有時也叫做BPTT(back-propagation through time)。當然這里的BPTT和DNN也有很大的不同點,即這里所有的 U,W,V,b,c 在序列的各個位置是共享的,反向傳播時我們更新的是相同的參數(shù)。

為了簡化描述,這里的損失函數(shù)我們?yōu)榻徊骒負p失函數(shù),輸出的激活函數(shù)為softmax函數(shù),隱藏層的激活函數(shù)為tanh函數(shù)。

對于RNN,由于我們在序列的每個位置都有損失函數(shù),因此最終的損失 L 為:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

其中 V,c,的梯度計算是比較簡單的:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

但是 W,U,b 的梯度計算就比較的復雜了。從RNN的模型可以看出,在反向傳播時,在在某一序列位置t的梯度損失由當前位置的輸出對應的梯度損失和序列索引位置 t+1 時的梯度損失兩部分共同決定。對于 W 在某一序列位置t的梯度損失需要反向傳播一步步的計算。我們定義序列索引 t 位置的隱藏狀態(tài)的梯度為:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

這樣我們可以像DNN一樣從遞推?。

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

對于,由于它的后面沒有其他的序列索引了,因此有:

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

有了

循環(huán)神經(jīng)網(wǎng)絡模型與前向反向傳播算法

除了梯度表達式不同,RNN的反向傳播算法和DNN區(qū)別不大,因此這里就不再重復總結了。

5. RNN小結

上面總結了通用的RNN模型和前向反向傳播算法。當然,有些RNN模型會有些不同,自然前向反向傳播的公式會有些不一樣,但是原理基本類似。

RNN雖然理論上可以很漂亮的解決序列數(shù)據(jù)的訓練,但是它也像DNN一樣有梯度消失時的問題,當序列很長的時候問題尤其嚴重。因此,上面的RNN模型一般不能直接用于應用領域。在語音識別,手寫書別以及機器翻譯等NLP領域?qū)嶋H應用比較廣泛的是基于RNN模型的一個特例LSTM,下一篇我們就來討論LSTM模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:循環(huán)神經(jīng)網(wǎng)絡(RNN)模型與前向反向傳播算法

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    神經(jīng)網(wǎng)絡教程(李亞非)

    網(wǎng)絡BP算法的程序設計  多層網(wǎng)絡BP算法源程序  第4章 Hopfield
    發(fā)表于 03-20 11:32

    【案例分享】基于BP算法神經(jīng)網(wǎng)絡

    傳播的,不會回流),區(qū)別于循環(huán)神經(jīng)網(wǎng)絡RNN。BP算法(Back Propagation):誤差反向傳播
    發(fā)表于 07-21 04:00

    神經(jīng)網(wǎng)絡反向傳播算法

    03_深度學習入門_神經(jīng)網(wǎng)絡反向傳播算法
    發(fā)表于 09-12 07:08

    手動設計一個卷積神經(jīng)網(wǎng)絡傳播反向傳播

    本文主要寫卷積神經(jīng)網(wǎng)絡如何進行一次完整的訓練,包括傳播反向傳播,并自己手寫一個卷積
    的頭像 發(fā)表于 05-28 10:35 ?1.8w次閱讀
    手動設計一個卷積<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(<b class='flag-5'>前</b><b class='flag-5'>向</b><b class='flag-5'>傳播</b>和<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>)

    淺析深度神經(jīng)網(wǎng)絡(DNN)反向傳播算法(BP)

    在 深度神經(jīng)網(wǎng)絡(DNN)模型傳播算法 中,我們對DNN的
    的頭像 發(fā)表于 03-22 16:28 ?3725次閱讀
    淺析深度<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(DNN)<b class='flag-5'>反向</b><b class='flag-5'>傳播</b><b class='flag-5'>算法</b>(BP)

    反向傳播神經(jīng)網(wǎng)絡建模的基本原理

    反向傳播神經(jīng)網(wǎng)絡(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡)是一種多層
    的頭像 發(fā)表于 07-02 14:05 ?347次閱讀

    反向傳播神經(jīng)網(wǎng)絡模型的特點

    反向傳播神經(jīng)網(wǎng)絡(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡)是一種多層
    的頭像 發(fā)表于 07-02 14:14 ?465次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法原理是什么

    神經(jīng)網(wǎng)絡反向傳播算法(Backpropagation Algorithm)是一種用于訓練多層神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 07-02 14:16 ?765次閱讀

    神經(jīng)網(wǎng)絡傳播反向傳播區(qū)別

    神經(jīng)網(wǎng)絡是一種強大的機器學習模型,廣泛應用于各種領域,如圖像識別、語音識別、自然語言處理等。神經(jīng)網(wǎng)絡的核心是
    的頭像 發(fā)表于 07-02 14:18 ?934次閱讀

    反向傳播神經(jīng)網(wǎng)絡和bp神經(jīng)網(wǎng)絡的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡)是一種多層
    的頭像 發(fā)表于 07-03 11:00 ?867次閱讀

    神經(jīng)網(wǎng)絡傳播反向傳播神經(jīng)網(wǎng)絡訓練過程中的作用

    神經(jīng)網(wǎng)絡是一種強大的機器學習模型,它通過模擬人腦神經(jīng)元的連接方式來處理復雜的數(shù)據(jù)。神經(jīng)網(wǎng)絡的核心是
    的頭像 發(fā)表于 07-03 11:11 ?1591次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法的推導過程

    反向傳播算法的推導過程,包括傳播、損失函數(shù)、梯度計算和權重更新等步驟。
    的頭像 發(fā)表于 07-03 11:13 ?670次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法的原理、數(shù)學推導及實現(xiàn)步驟

    神經(jīng)網(wǎng)絡反向傳播算法(Backpropagation Algorithm)是一種用于訓練多層神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 07-03 11:16 ?963次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法的作用是什么

    神經(jīng)網(wǎng)絡反向傳播算法(Backpropagation)是一種用于訓練人工神經(jīng)網(wǎng)絡算法,它通過計
    的頭像 發(fā)表于 07-03 11:17 ?1571次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法的優(yōu)缺點有哪些

    神經(jīng)網(wǎng)絡反向傳播算法(Backpropagation Algorithm)是一種廣泛應用于深度學習和機器學習領域的優(yōu)化算法,用于訓練多層
    的頭像 發(fā)表于 07-03 11:24 ?1217次閱讀
    赌场百家乐官网代理| 百家乐平台哪个好本站所有数据都是网友推荐及提供 | 网上现金博彩网| 百家乐庄的概率| 岗巴县| 百家乐五湖四海娱乐平台| 百家乐官网桌布专业| 大发888游戏官方下载客户端| 蓝宝石百家乐官网娱乐城| 百家乐翻天粤语| 网上百家乐游戏下载| 百家乐官网一柱擎天| 大发888注册优惠代码| 百家乐官网技巧开户| 网上百家乐官网哪里| YY百家乐的玩法技巧和规则| 百家乐官网真人游戏娱乐| 百家乐平台凯发| 百家乐官网积分| 皇冠赔率| 斗地主百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城易博| 百家乐官网www| 明升国际| 百家乐贴士介绍| 做生意店铺风水好吗| 百家乐官网平台信誉| 易胜博网| 百家乐最新分析仪| 百家乐官网官方网站| 百家乐官网趋势图怎么看| 大发888.com| 御金百家乐娱乐城| 神话百家乐官网的玩法技巧和规则 | 太阳城百家乐官网外挂| 皇冠现金投注网| 百家乐如何赚洗码| 娱乐城百家乐高手| 百家乐官网7scs娱乐平台| 德昌县| 德州扑克英文|