归档: 2021/8

A Unified MRC Framework for Named Entity Recognition

2021-08-27

把ner的序列标注问题做成是一个阅读理解的问题(MRC)。把训练数据变成(上下文，问题，答案)，训练的时候BERT的输入是把问题和上下文连起来用[SEP]分开，前后各加一个[CLS]。这就是为了和BERT保持一致。然后BERT的输出把第一句问题的表示向量给删了，只要后面上下文的表示向量。然后后面接了一个match model
Joint Biomedical Entity and Relation Extraction with Knowledge-Enhanced Collective Inference

2021-08-27
提出一个新的利用外部知识的联合抽取框架KECI (Knowledge-Enhanced Collective Inference)

要点
分三步：
1. 将input text结构化为初始化图(initial span graph)，作为对输入文本的初步理解。在一个span graph里每个node表示一个entity，每条edge表示两个entity的relation
2. 然后在一个额外的知识库里使用entities linker形成一个包含所有潜在有关联的生物医学实体的背景知识图(background knowledge graph)，对于每个entity从上面提到的知识库(KB)里提取它的semantic types，definition sentence以及relational information
3. 最后KECI使用注意力机制融合上述两个graph成一个更refined的graph
A Unified Generative Framework for Various NER Subtasks

2021-08-11

核心思想：不做序列标注了，把ner任务转换成文本生成任务，用一个seq2seq模型去生成一个entity span sequence，这样就不需要设计复制的tagging模式了

seq2seq模型是用的BART

原文
A Unified Generative Framework for Various NER Subtasks

归档: 2021/8

A Unified MRC Framework for Named Entity Recognition

Joint Biomedical Entity and Relation Extraction with Knowledge-Enhanced Collective Inference

要点

A Unified Generative Framework for Various NER Subtasks

原文