命名实体识别任务基础
参考:https://github.com/zyds/transformers-code
一、命名实体识别简介
命名实体识别(Named Entity Recognition,NER)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分(1)实体边界识别(2)确定实体类别
1. 数据标注体系
1.1 IOB2标注
I 实体内部 O实体外部 B实体开始
B/I-XX X,X表示具体类别
1.2 IOBES标注
I 实体内部 O实体外部 B实体开始 E实体结束 S一个单词单独形成一个命名实体
有时用M代替I
2. 评估指标
precision、recall、F1

3. 基于Transformers的解决方案
self.bert---sequence_output---classifier
4. 评估函数
seqeval
浙公网安备 33010602011771号