会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
在代码的道路上倔强
博客园
首页
新随笔
联系
订阅
管理
2020年4月10日
第三篇:Named Entity Recognition for Chinese Social Media with Jointly Trained Embeddings
摘要: 一、本文主要内容 1、(语标代替字母)问题:(1)中文命名实体识别中存在拼写错误、新词、不符合语法的结构;(2)缺乏明确的边界;(3)词切分糟糕;(4)典型的语料库只使用简体或繁体,但是社交媒体是混合的;(5)基于word的embedding,并不能在下游任务中有用; 2、先前技术:(1)CRF w
阅读全文
posted @ 2020-04-10 11:58 在代码的道路上倔强
阅读(543)
评论(0)
推荐(1)
公告