1MUC Data Sets
https://www-nlpir.nist.gov/related_projects/muc/
2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/
3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創建的,重點關注4個實體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實體) https://www.clips.uantwerpen.be/conll2003/ner/
42010 I2B2
2010 I2B2 NER任務考慮了臨床數據,重點關注臨床問題、測試和治療實體類型
https://www.i2b2.org/NLP/Relations/
5DDIExtraction2013(Drug NER)
重點關注藥品、品牌、集團和藥品n(未批準或新藥)實體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html
6CHEMPROT(Similar to 5)
相比5更側重于化學和藥物實體,例如縮寫、配方、家族、標識符等
https://biocreative.bioinformatics.udel.edu/
7 microbiology NER datasets
從PubMed和生物學網站收集,并且主要關注細菌、棲息地和地理位置實體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)
責任編輯:xj
原文標題:一些NER的英文數據集
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
數據集
+關注
關注
4文章
1209瀏覽量
24836 -
nlp
+關注
關注
1文章
489瀏覽量
22111
原文標題:一些NER的英文數據集
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
ads1232獲取的數據中經常有一些比較大的值或者一些錯誤值,這個是因為什么原因?
數據手冊中的一些參數的數值有時畫一條橫線或者空著不填是什么意思?
云原生和數據庫哪個好一些?
ADS1284通過SPI讀取數據,長期采集的時候發現會小概率丟一些數據,什么原因?
一些常見的動態電路
![<b class='flag-5'>一些</b>常見的動態電路](https://file1.elecfans.com/web1/M00/F4/F1/wKgaoWc0ATSAA4smAAARqkK1SoQ655.gif)
分享一些常見的電路
![分享<b class='flag-5'>一些</b>常見的電路](https://file1.elecfans.com/web1/M00/F4/F1/wKgaoWc0ATSAA4smAAARqkK1SoQ655.gif)
pycharm怎么訓練數據集
咨詢一些關于LED燈具的問題
為什么在一些路由器中使用ESP32的Active mode無法接收服務器的TCP數據呢?
細談SolidWorks教育版的一些基礎知識
Tekvpi探頭接口的一些好處是什么?
![Tekvpi探頭接口的<b class='flag-5'>一些</b>好處是什么?](https://file1.elecfans.com//web2/M00/C5/60/wKgZomX87dWAU-r-AAD2ox-cMaA31.jpeg)
評論