NER场景,其实在实际业务中也非常常见,现在也有很多基于这方面的研究,这里单独开一篇博客,不断积累记录这方面的研究和方法,供学习
MECT
论文标题:
MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity Recognition
论文链接:
https://aclanthology.org/2021.acl-long.121.pdf
解读:中文NER涨点神器!基于多元数据的双流Transformer编码模型
主要创新点就是在模型中融合进汉字的结构信息(例如部首等)。同时可以学习一下FLAT
NER数据增强
主要就是看看NER领域怎么进行数据增强:
打开你的脑洞:NER如何进行数据增强 ? - 知乎
低资源和跨语言NER任务的新进展:词级别数据增强技术
NER数据漏标:
ICLR2021 中唯一录取的NER论文:NER数据存在漏标怎么办? - 知乎