一种融合指代消解序列标注方法在中文人名识别上的应用(下)
二、使用了 BERT 模型和指代消解算法:
加入 BERT 语言预处理模型,获取到高质量动态词向量。
融入指代消解算法,根据指代词找出符合要求的子串/短语。
【2】融入指代消解算法,根据指代词找出符合要求的子串/短语
复制代码
复制代码
复制代码
【3】融入的指代消解算法,比加入外部语料和字符级特征更通用有效
复制代码
总结
本文提出的融合指代消解序列标注方法,在以下四个方面有较强的创新性
数据预处理阶段,根据职务变更等有效信息进行数据增强
加入 BERT 语言预处理模型,获取到高质量动态词向量
融入指代消解算法,根据指代词找出符合要求的子串/短语
融入的指代消解算法,比加入外部语料和字符级特征更通用有效
该算法未来将拓展至机构名、地名以及其他所有以名称为标识的实体,能更好的服务于京东小程序客户体验中的寄收件地址的文本识别中,提高相关识别的准确率。
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/4a411b2b5069f501024771110】。文章转载请联系作者。
评论