吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于機器翻譯增加的跨語言機器閱讀理解算法

OSC開源社區 ? 來源:OSCHINA 社區 ? 2023-12-12 10:28 ? 次閱讀

作者:阿里云云棲號

鏈接:https://my.oschina.net/yunqi/blog/10319964

近日,阿里云人工智能平臺 PAI 與華南理工大學朱金輝教授團隊、達摩院自然語言處理團隊合作在自然語言處理頂級會議 EMNLP2023 上發表基于機器翻譯增加的跨語言機器閱讀理解算法 X-STA。通過利用一個注意力機制的教師來將源語言的答案轉移到目標語言的答案輸出空間,從而進行深度級別的輔助以增強跨語言傳輸能力。同時,提出了一種改進的交叉注意力塊,稱為梯度解纏知識共享技術。此外,通過多個層次學習語義對齊,并利用教師指導來校準模型輸出,增強跨語言傳輸性能。實驗結果顯示,我們的方法在三個多語言 MRC 數據集上表現出色,優于現有的最先進方法。

背景

大規模預訓練語言模型的廣泛應用,促進了 NLP 各個下游任務準確度大幅提升,然而,傳統的自然語言理解任務通常需要大量的標注數據來微調預訓練語言模型。但低資源語言缺乏標注數據集,難以獲取。大部分現有的 MRC 數據集都是英文的,這對于其他語言來說是一個困難。其次,不同語言之間存在語言和文化的差異,表現為不同的句子結構、詞序和形態特征。例如,日語、中文、印地語和阿拉伯語等語言具有不同的文字系統和更復雜的語法系統,這使得 MRC 模型難以理解這些語言的文本。

為了解決這些挑戰,現有文獻中通常采用基于機器翻譯的數據增強方法,將源語言的數據集翻譯成目標語言進行模型訓練。然而,在 MRC 任務中,由于翻譯導致的答案跨度偏移,無法直接使用源語言的輸出分布來教導目標語言。

e745a39a-9816-11ee-8b88-92fbcf53809c.jpg

因此,本文提出了一種名為 X-STA 的跨語言 MRC 方法,遵循三個原則:共享、教導和對齊。共享方面,提出了梯度分解的知識共享技術,通過使用平行語言對作為模型輸入,從源語言中提取知識,增強對目標語言的理解,同時避免源語言表示的退化。教導方面,本方法利用注意機制,在目標語言的上下文中尋找與源語言輸出答案語義相似的答案跨度,用于校準輸出答案。對齊方面,多層次的對齊被利用來進一步增強 MRC 模型的跨語言傳遞能力。通過知識共享、教導和多層次對齊,本方法可以增強模型對不同語言的語言理解能力。

算法概述

X-STA 模型框架圖如下所示:

e749d762-9816-11ee-8b88-92fbcf53809c.jpg

e75a1514-9816-11ee-8b88-92fbcf53809c.jpg

具體流程如下:

先將源語言的目標數據翻譯到各個目標語言,目標語言的測試數據也翻譯回源語言。

每項數據包含問題 Q 和上下文段落 C。

構建并行語言對 ={源語言訓練數據,目標語言訓練數據} 送入模型并使用反向傳播進行模型訓練。

將并行語言對 ={源語言測試數據,目標語言測試數據} 送入模型獲取答案的預測。

算法精度評測

為了驗證 X-STA 算法的有效性,我們在三個跨語言 MRC 數據集上進行了測試,效果證明 X-STA 對精度提升明顯:

e76a67de-9816-11ee-8b88-92fbcf53809c.jpg

我們也對算法的模塊進行了詳細有效性分析,我們可以發現各模塊均對模型有一定貢獻。

e76de5c6-9816-11ee-8b88-92fbcf53809c.jpg

為了更好地服務開源社區,這一算法的源代碼即將貢獻在自然語言處理算法框架 EasyNLP 中,歡迎 NLP 從業人員和研究者使用。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93354
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240282
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24833
  • 阿里云
    +關注

    關注

    3

    文章

    974

    瀏覽量

    43230
  • 自然語言處理

    關注

    1

    文章

    619

    瀏覽量

    13646

原文標題:基于知識遷移的跨語言機器閱讀理解算法

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器翻譯三大核心技術原理 | AI知識科普

    、雞同鴨講,這一點機器翻譯還是可以做到的!01機器翻譯和巴別塔的傳說《圣經》中記載了這樣一個故事:人類曾經聯合起來興建能通往天堂的高塔——巴別塔,為了阻止人類的計劃,上帝讓人類說不同的語言,使人類
    發表于 07-06 10:30

    機器翻譯三大核心技術原理 | AI知識科普 2

    了額外的機制——注意力機制,來幫助我們進行調序。下面我們用一張示意圖來看一下,基于RNN的神經機器翻譯的流程:首先我們通過分詞得到輸入源語言詞序列,接下來每個詞都用一個詞向量進行表示,得到相應的詞向量序列
    發表于 07-06 10:46

    神經機器翻譯的方法有哪些?

    目前,神經機器翻譯(NMT)已經成為在學術界和工業界最先進的機器翻譯方法。最初的這種基于編碼器-解碼器架構的機器翻譯系統都針對單個語言對進行翻譯
    發表于 11-23 12:14

    阿里巴巴機器翻譯在跨境電商場景下的應用和實踐

    摘要: ?本文將與大家分享機器翻譯相關背景知識,再深入介紹機器翻譯在阿里生態中的具體應用實踐,介紹基于機器翻譯技術搭建的一套完善的電商多語言解決方案,最后將會從技術角度介紹阿里
    發表于 07-31 17:22 ?457次閱讀
    阿里巴巴<b class='flag-5'>機器翻譯</b>在跨境電商場景下的應用和實踐

    換個角度來聊機器翻譯

    同時期國內科技企業在機器翻譯上的進展也非常迅速,以語音和語義理解見長的科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名,在2015年又在由美國國家
    的頭像 發表于 04-24 13:55 ?3530次閱讀
    換個角度來聊<b class='flag-5'>機器翻譯</b>

    科大訊飛機器翻譯首次達到專業譯員水平 機器閱讀超越人類平均水平

    機器翻譯首次達到專業譯員水平。去年11月,科大訊飛機器翻譯系統參加CATTI全國翻譯專業資格(水平)科研測試,達到英語二級《口譯實務(交替傳譯類)》和三級《口譯實務》合格標準,二級是專業譯員水平
    的頭像 發表于 05-24 08:41 ?8380次閱讀

    機器翻譯走紅的背后是什么

    未來需要新的算法和語義層面的綜合性突破,促進機器翻譯產品的迭代和產業全面升級。
    發表于 07-14 10:02 ?1040次閱讀

    MIT和谷歌開發失傳語言機器翻譯系統

    注釋數據庫和讓機器從中學習的技術讓語言學習發生了革命性變化,這使得機器翻譯變得越來越普遍。
    發表于 07-17 10:56 ?642次閱讀

    未來機器翻譯會取代人工翻譯

    所謂機器翻譯,就是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。它是計算語言
    的頭像 發表于 12-29 10:12 ?5075次閱讀

    語言翻譯新范式的工作:機器翻譯界的BERT

    思想就是打造“機器翻譯界的BERT”,通過預訓練技術再在具體語種上微調即可達到領先的翻譯效果,其在32個語種上預訓練出的統一模型在47個翻譯測試集上取得了全面顯著的提升。 目錄 機器翻譯
    的頭像 發表于 03-31 17:24 ?3036次閱讀
    多<b class='flag-5'>語言</b><b class='flag-5'>翻譯</b>新范式的工作:<b class='flag-5'>機器翻譯</b>界的BERT

    基于短語的漢語維吾爾語機器翻譯系統

    ,對詞級粒度、詞干級粒度、最大詞干級粒度、詞干詞綴級粒度、詞干-詞尾級粒度的漢維平行語料庫進行對比實驗,研究不同粒度的維吾爾語對漢維機器翻譯中的詞語對齊質量和語言模型質量的影響。實驗結果表明,在上述5種粒度的維
    發表于 05-11 15:34 ?9次下載

    基于DNN與規則學習的機器翻譯算法綜述

    基于DNN與規則學習的機器翻譯算法綜述
    發表于 06-29 15:44 ?33次下載

    借助機器翻譯來生成偽視覺-目標語言對進行語言遷移

    然而之前的基于機器翻譯的CCR工作大多忽略了這個問題,它們通常使用大規模的預訓練模型在通過機器翻譯得到的大規模多語言視覺-語言語料庫上進行大規模預訓練,并且只關注于視覺-目標
    的頭像 發表于 10-14 14:59 ?921次閱讀

    語言模型的多語言機器翻譯能力分析

    以ChatGPT為代表的大語言模型(Large Language Models, LLM)在機器翻譯(Machine Translation, MT)任務上展現出了驚人的潛力。
    的頭像 發表于 05-17 09:56 ?2173次閱讀
    大<b class='flag-5'>語言</b>模型的多<b class='flag-5'>語言</b><b class='flag-5'>機器翻譯</b>能力分析

    機器翻譯研究進展

    機器翻譯使用計算機將一種語言翻譯成另一種語言,具有低成本、高效率和高翻譯質量等優勢,在語音翻譯
    的頭像 發表于 07-06 11:19 ?904次閱讀
    <b class='flag-5'>機器翻譯</b>研究進展
    百家乐赚钱项目| 在线百家乐博彩| 大发888官方体育| 开心8百家乐官网现金网| 属狗与属鸡做生意| 大发888 制度| 百家乐官网赌博技巧论坛| 网上百家乐是真的| 万通国际娱乐| 百家乐官网红桌布| 大发888好吗| 百家乐官网赌博是否违法| 百家乐娱乐代理| 百家乐官网什么叫缆| 百家乐的规则博彩正网| 英皇国际娱乐城| 百家乐官网白茫茫| 百家乐官网分析仪有真的吗| 大世界百家乐娱乐场| 网络百家乐官网可靠吗| 百家乐六合彩3535| 壶关县| 澳门百家乐赢钱技术| 瑞奇国际娱乐| 百家乐官网发牌| 百乐门| 百家乐扑克投注赢钱法| 武乡县| 百家乐送18元彩金| 手游| 百家乐赌博程序| 如何看百家乐官网的路纸| 钱隆百家乐破解版| 网络百家乐官网真假| 全讯网hg8599.com| 百家乐官网娱乐平台网77scs | 百家乐官网打水策略| 青鹏百家乐游戏币| 百家乐官网长龙太阳城| 励骏会百家乐的玩法技巧和规则| 百家乐官网马宝|