摘要: 一、本文主要内容 1、(语标代替字母)问题:(1)中文命名实体识别中存在拼写错误、新词、不符合语法的结构;(2)缺乏明确的边界;(3)词切分糟糕;(4)典型的语料库只使用简体或繁体,但是社交媒体是混合的;(5)基于word的embedding,并不能在下游任务中有用; 2、先前技术:(1)CRF w 阅读全文
posted @ 2020-04-10 11:58 在代码的道路上倔强 阅读(543) 评论(0) 推荐(1)