論文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition
鏈接:https://aclanthology.org/2021.acl-long.372.pdf
代碼:https://github.com/foxlf823/sodner
提取摘要
由于普通的NER問題被研究的透透的了,本文主要解決一種稍微復雜些問題:一種帶有覆蓋和不連續(Overlapped and Discontinuous)的命名實體識別任務。
而在這兩者研究上來說,前人只是要么解決覆蓋問題,要么解決不連續問題,但是本文提出一種聯合解決這兩種問題的span-based方法。
span-based方法昨天也提到過了,所以關于實體+關系抽取的任務都可以嘗試。
本文通過兩個步驟構建模型:
通過列舉所有可能的text span來識別出實體片段(entity fragments);
在這些entity fragments上預測是兩種關系overlapping or succession。
這樣,我們不僅可以識別Discontinuous的實體,同時也可以對Overlapped的實體進行雙重檢查。
通過上述方法輕松將NER裝換成RE(Relation Extraction)任務。最終實驗在很多數據集上比如CLEF, GENIA andACE05上展現除了很強勁的性能。
該模型的步驟為
input一方面通過pre-train模型獲取word rep,一方面通過dependency parsing獲取句法信息;
GCN集合LSTM的輸出和句法輸入,得到syntax-enhanced的新的表達;
獲取所有span表示;
通過兩個MLP預測span是否為實體,以及實體時間是否有關系;
最后每個loss加上權重,為最終優化目標。
關鍵分類
AGGCN用來融入句法信息
attention-guided GCN (AGGCN)比普通GCN要強一些,所以這里選用該方法。傳統的GCN:
而AGGCN就是使用self-attention,替換以前的鄰接矩陣A,最后通過線性方法將multi head生成的結果合一:
Span的表示
解碼先預測實體片段,再預測關系。
解碼公式
損失計算
實驗實驗數據介紹
在數據上的表現
在其他數據上與前人的對比,雖然性能不如SOTA,但是這種Span-based方式和SOTA差不了多少,是個新穎的想法。
責任編輯:haq
-
模型
+關注
關注
1文章
3313瀏覽量
49233 -
nlp
+關注
關注
1文章
489瀏覽量
22111
原文標題:ACL2021 | 一種巧妙解決NER覆蓋和不連續問題的方法
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
采用AD62P29進行模數轉換,對正弦信號的轉換后的波形不連續,會出現臺階?為什么?
ADS1282無法實現轉換速率為128K的連續轉換與數據讀取,如何解決?
ADS1115返回值不連續是怎么回事?
ADS127L01使用Start從0到1啟動ADC轉換,DRDY不連續出現,為什么?
SRC4190波形不連續的原因?怎么解決?
BP神經網絡在處理不連續變量時的應用
PMP30921.1-4W 不連續導通模式初級側調節反激式 PCB layout 設計
![PMP30921.1-4W <b class='flag-5'>不</b><b class='flag-5'>連續</b>導通模式初級側調節反激式 PCB layout 設計](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
PMP31007.1-隔離式 12W 不連續導通模式 (DCM) 反激式 PCB layout 設計
![PMP31007.1-隔離式 12W <b class='flag-5'>不</b><b class='flag-5'>連續</b>導通模式 (DCM) 反激式 PCB layout 設計](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
評論