吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)述位置編碼在注意機(jī)制中的作用

深度學(xué)習(xí)自然語言處理 ? 來源:DeepHub ? 作者:DeepHub ? 2021-06-16 17:19 ? 次閱讀

神經(jīng)網(wǎng)絡(luò)知識(shí)。

有一種叫做注意機(jī)制的東西,但是你不需要知道注意力具體實(shí)現(xiàn)。

RNN/LSTM的不足。

A. Vaswani等人的《Attention Is All You Need》被認(rèn)為是解決了眾所周知的LSTM/RNN體系結(jié)構(gòu)在深度學(xué)習(xí)空間中的局限性的突破之一。本文介紹了transformers 在seq2seq任務(wù)中的應(yīng)用。該論文巧妙地利用了 D.Bahdanau 等人通過聯(lián)合學(xué)習(xí)對(duì)齊和翻譯的神經(jīng)機(jī)器翻譯注意機(jī)制的使用。并且提供一些示例明確且詳盡地解釋了注意力機(jī)制的數(shù)學(xué)和應(yīng)用。

在本文中,我將專注于注意力機(jī)制的位置編碼部分及其數(shù)學(xué)。

假設(shè)您正在構(gòu)建一個(gè) seq2seq 學(xué)習(xí)任務(wù),并且您想要開發(fā)一個(gè)模型,該模型將輸入英語句子并將其翻譯成其他 語言。“All animals are equal but some are more equal than others ”→Badhā prā?ī’ō samāna chē parantu kē?alāka an’ya karatā vadhu samāna chē你的第一步是獲取這個(gè)輸入句子,運(yùn)行一個(gè)分詞器,將它轉(zhuǎn)換成數(shù)字,然后將它傳遞給一個(gè)嵌入層,這可能會(huì)為這個(gè)句子中的每個(gè)單詞添加一個(gè)額外的維度。

在運(yùn)行 RNN 或 LSTM 時(shí),隱藏狀態(tài)保留單詞在句子中的相對(duì)位置信息。然而,在 Transformer 網(wǎng)絡(luò)中,如果編碼器包含一個(gè)前饋網(wǎng)絡(luò),那么只傳遞詞嵌入就等于為您的模型增加了不必要的混亂,因?yàn)樵谠~嵌入中沒有捕獲有關(guān)句子的順序信息。為了處理單詞相對(duì)位置的問題,位置編碼的想法出現(xiàn)了。

在從嵌入層提取詞嵌入后,位置編碼被添加到這個(gè)嵌入向量中。

解釋位置編碼最簡(jiǎn)單的方法是為每個(gè)單詞分配一個(gè)唯一的數(shù)字 ∈ ? 。或者為每個(gè)單詞分配一個(gè)在 [0,1] ∈ ? 范圍內(nèi)的實(shí)數(shù)(如果輸入句子很長,這樣可以處理很大的值)。但是,上述兩種方法都沒有捕捉到單詞之間時(shí)間步長的準(zhǔn)確性。為了克服這個(gè)問題,本文使用了 sin 和 cosine 函數(shù)形式的位置編碼。

打個(gè)比方,我們輸入模型的序列,無論是句子、視頻序列還是股票市場(chǎng)價(jià)格數(shù)據(jù),都將始終是時(shí)域信號(hào)。表示時(shí)域信號(hào)的最佳方式是通過正弦方程 sin(ωt)。如果我們巧妙地使用這個(gè)波動(dòng)方程,我們可以在一次拍攝中捕獲詞嵌入的時(shí)間和維度信息。

讓我們看一下這個(gè)等式,在接下來的步驟中,我們將嘗試把它形象化。

052682a0-cab3-11eb-9e57-12bb97331649.png

讓我們考慮一個(gè)簡(jiǎn)單的句子,它被分詞,然后它的詞嵌入被提取。句子長度為5,嵌入維數(shù)為8。因此,每個(gè)單詞都表示為1x8的向量。

現(xiàn)在我們?cè)跁r(shí)間維度上取一個(gè)序列把正弦PE向量加到這個(gè)嵌入向量上。

進(jìn)一步,我們對(duì)沿dim維數(shù)的其他向量做類似的操作。

本文在嵌入向量中交替加入正弦和余弦。如果dim是偶數(shù),則sin級(jí)數(shù)相加,如果dim是奇數(shù),則cos級(jí)數(shù)相加。

這很好地捕獲了沿時(shí)間維度(或等式中描述的 pos 維度。我將 pos 和 time 互換使用,因?yàn)樗鼈円馕吨嗤氖虑椋┑侨绾我膊东@沿dims維度的相對(duì)位置信息呢?這里的答案也在于等式本身。ω 項(xiàng)。

05f41878-cab3-11eb-9e57-12bb97331649.png

隨著 i 從 0 增加到 d_embedding/2,頻率也從 1/2π 減少到 1/(2π.10000)

因此我們看到,沿著無序方向的每個(gè)向量,位置的唯一性被捕獲。該論文還描述了這種編碼的魯棒性。但是我仍然無法找出為什么特別使用數(shù)字 10000 進(jìn)行位置編碼(它可能是一個(gè)超參數(shù)嗎?)。這個(gè)解釋粗略地展示了如何使用正弦和余弦對(duì)于模型理解是非常合理和有效的。下面的圖表本身講述了位置編碼如何隨位置(時(shí)間)和尺寸變化。

人們可以很容易地看到,這些是簡(jiǎn)單的時(shí)頻圖,其中位置代表時(shí)間,深度代表頻率。時(shí)間頻率圖已被用于從射電天文學(xué)到材料光譜分析的許多應(yīng)用中。因此,從現(xiàn)有的現(xiàn)實(shí)世界系統(tǒng)構(gòu)建類比確實(shí)可以更好地理解問題。

這是我對(duì)注意力機(jī)制中使用的位置編碼的看法。在接下來的系列中,我將嘗試撰寫有關(guān)編碼器-解碼器部分的內(nèi)容,并將注意力應(yīng)用于現(xiàn)實(shí)世界的規(guī)模問題。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101169
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    957

    瀏覽量

    54951
  • rnn
    rnn
    +關(guān)注

    關(guān)注

    0

    文章

    89

    瀏覽量

    6914
  • LSTM
    +關(guān)注

    關(guān)注

    0

    文章

    59

    瀏覽量

    3793

原文標(biāo)題:位置編碼在注意機(jī)制中的作用

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    編碼機(jī)器人技術(shù)的應(yīng)用 編碼傳感器系統(tǒng)作用

    編碼機(jī)器人技術(shù)扮演著至關(guān)重要的角色,特別是傳感器系統(tǒng),其作用不可忽視。以下是對(duì)
    的頭像 發(fā)表于 11-24 10:02 ?768次閱讀

    編碼器的安裝注意事項(xiàng) 磁編碼測(cè)量系統(tǒng)作用

    編碼器的安裝注意事項(xiàng) 磁編碼器的安裝過程需要特別注意以下幾點(diǎn),以確保其能夠正常工作并長期保持高精度: 避免直接沖擊 : 安裝磁
    的頭像 發(fā)表于 11-23 09:28 ?361次閱讀

    編碼工業(yè)自動(dòng)化的應(yīng)用

    編碼工業(yè)自動(dòng)化的應(yīng)用非常廣泛,其基于磁場(chǎng)變化來測(cè)量轉(zhuǎn)速和位置的工作原理,使其提升生產(chǎn)效率、優(yōu)化產(chǎn)品質(zhì)量以及降低能耗等方面發(fā)揮著不可
    的頭像 發(fā)表于 11-23 09:09 ?635次閱讀

    MySQL編碼機(jī)制原理

    前言 一位讀者本地部署 MySQL 測(cè)試環(huán)境時(shí)碰到一個(gè)問題,我覺得挺有代表性的,所以寫篇文章介紹一下,看完相信你會(huì)對(duì) MySQL 的編碼機(jī)制有最本質(zhì)的了解,本文的目錄結(jié)構(gòu)如下 讀者問題簡(jiǎn)介
    的頭像 發(fā)表于 11-09 11:01 ?299次閱讀

    對(duì)于多級(jí)放大電路板,PCB布局,電源擺放的位置應(yīng)該注意什么?

    對(duì)于多級(jí)放大電路板,PCB布局,電源擺放的位置應(yīng)該注意什么,我一些資料上看到過:多級(jí)放大電路
    發(fā)表于 09-20 08:25

    全極霍爾傳感器AH471電動(dòng)牙刷位置檢測(cè)作用

    全極霍爾傳感器AH471電動(dòng)牙刷位置檢測(cè)作用
    的頭像 發(fā)表于 09-14 09:58 ?373次閱讀
    全極霍爾傳感器AH471<b class='flag-5'>在</b>電動(dòng)牙刷<b class='flag-5'>中</b>起<b class='flag-5'>位置</b>檢測(cè)<b class='flag-5'>作用</b>

    電機(jī)控制系統(tǒng)編碼器概述與作用

    編碼器分辨率是描述編碼測(cè)量運(yùn)動(dòng)過程中所能分辨的最小位置變化量的指標(biāo)。理解編碼器分辨率對(duì)于設(shè)計(jì)和實(shí)現(xiàn)高精度的運(yùn)動(dòng)控制系統(tǒng)至關(guān)重要。以下是對(duì)
    的頭像 發(fā)表于 08-17 19:49 ?665次閱讀

    簡(jiǎn)述半導(dǎo)體原理——晶體管家族的核心工作機(jī)制

    簡(jiǎn)述半導(dǎo)體原理——晶體管家族的核心工作機(jī)制
    的頭像 發(fā)表于 07-20 08:14 ?1083次閱讀
    <b class='flag-5'>簡(jiǎn)述</b>半導(dǎo)體原理——晶體管家族的核心工作<b class='flag-5'>機(jī)制</b>

    伺服電機(jī)編碼器的作用和功能是什么

    伺服電機(jī)編碼器是伺服電機(jī)系統(tǒng)的重要組成部分,它的作用和功能對(duì)于整個(gè)系統(tǒng)的穩(wěn)定性、精度和可靠性具有至關(guān)重要的影響。本文將詳細(xì)介紹伺服電機(jī)編碼器的作用
    的頭像 發(fā)表于 06-17 11:09 ?2299次閱讀

    伺服電機(jī)編碼器起什么作用

    伺服電機(jī)編碼器是伺服系統(tǒng)的重要組成部分,它的作用是將伺服電機(jī)的旋轉(zhuǎn)位置、速度等信息轉(zhuǎn)換成電信號(hào),為控制系統(tǒng)提供反饋信息。 一、伺服電機(jī)編碼
    的頭像 發(fā)表于 06-17 10:52 ?2037次閱讀

    旋轉(zhuǎn)編碼PLC怎么編程

    工業(yè)自動(dòng)化領(lǐng)域,旋轉(zhuǎn)編碼器與可編程邏輯控制器(PLC)的結(jié)合應(yīng)用極為廣泛。旋轉(zhuǎn)編碼器通過提供精確的旋轉(zhuǎn)角度或位置信息,為PLC提供反饋信號(hào),進(jìn)而實(shí)現(xiàn)對(duì)設(shè)備的精確控制。本文將詳細(xì)介紹旋
    的頭像 發(fā)表于 06-17 09:24 ?1992次閱讀

    編碼機(jī)器人系統(tǒng)的應(yīng)用

    隨著科技的飛速發(fā)展,機(jī)器人技術(shù)已廣泛應(yīng)用于工業(yè)、醫(yī)療、服務(wù)等多個(gè)領(lǐng)域。機(jī)器人系統(tǒng)編碼器作為核心的位置和速度檢測(cè)裝置,發(fā)揮著至關(guān)重要的作用
    的頭像 發(fā)表于 06-13 14:51 ?964次閱讀

    編碼自動(dòng)化系統(tǒng)的應(yīng)用

    現(xiàn)代自動(dòng)化系統(tǒng)編碼器作為一種關(guān)鍵的位置和速度檢測(cè)裝置,發(fā)揮著不可替代的作用。它能夠?qū)㈦姍C(jī)的角位移或直線位移轉(zhuǎn)換為可計(jì)量的電信號(hào),為控制
    的頭像 發(fā)表于 06-13 14:50 ?982次閱讀

    伺服電機(jī)后面的編碼器起什么作用

    。本文將詳細(xì)介紹伺服電機(jī)后面的編碼器的作用、工作原理、分類以及伺服系統(tǒng)的應(yīng)用。 一、編碼器的作用
    的頭像 發(fā)表于 06-05 14:53 ?2085次閱讀

    絕對(duì)值編碼器的工作原理及其電機(jī)控制的應(yīng)用

    絕對(duì)值編碼電機(jī)控制系統(tǒng)的應(yīng)用 電機(jī)控制系統(tǒng),絕對(duì)值編碼器帶來了精確的
    的頭像 發(fā)表于 05-21 10:55 ?1354次閱讀
    絕對(duì)值<b class='flag-5'>編碼</b>器的工作原理及其<b class='flag-5'>在</b>電機(jī)控制<b class='flag-5'>中</b>的應(yīng)用
    百家乐扑克发牌器| 百家乐官网网上投注网站| 太阳城百家乐赌场| 利记百家乐官网现金网| 百家乐网上真钱娱乐场开户注册| 百家乐官网2棋牌作弊软件| 大发888大发娱乐城| 免费百家乐官网计划| 清徐县| 曼哈顿百家乐的玩法技巧和规则| 百家乐官网有诈吗| 利高国际网上娱乐| 网络百家乐证据| 广州百家乐官网赌场娱乐网规则| 百家乐赌博机| 送现金百家乐官网的玩法技巧和规则| 皇博国际| 广州百家乐筹码| 百家乐官网国际娱乐场| 全讯网导航| 新梦想百家乐的玩法技巧和规则| 怎样赢百家乐官网的玩法技巧和规则 | 请问下百家乐官网去哪个娱乐城玩最好呢| 博彩通天上人间| 大集汇百家乐的玩法技巧和规则| 荷规则百家乐官网的玩法技巧和规则 | 百家乐官网筹码免运费| 大佬娱乐城怎么样| 迪威百家乐娱乐平台| 伯爵百家乐官网娱乐| 天台县| 大发888中文下载| 百家乐庄家抽水的秘密| 网上百家乐官网怎么赌能赢钱| 必盛国际| 威尼斯人娱乐城正规吗| 百家乐桩闲落注点| 百家乐官网出老千视频| 玛曲县| 大发888真人赌博| 王子百家乐的玩法技巧和规则|