中文命名实体识别总结

欢迎大家关注我的知乎专栏,那里会分享我的项目总结以及所看的好博客
前段时间做了命名实体识别这个项目,在这里总结一下资源

命名实体识别的资料网上不多,尤其是让我们可以跟着做的。想要做这个方向,可以先找简单的入手。语料可以用人民日报标注语料,目前流行的方法有两种,一种基于CRF,一种基于深度学习。我个人强烈建议先做项目,再去深入理解原理,这两者相辅相成,才能成大事

本文脉络简单,就是从项目和原理两方面推荐给大家相关的博客
首先给大家一个开胃菜,先入门一下命名实体识别,总不能做了半天不知道自己在干什么吧
命名实体识别(NER)的二三事

一.项目

方法一:基于CRF做命名实体识别

  • 用CRF做命名实体识别(一)主要介绍的是关于人民日报标注语料的预处理,利用CRF++工具包对模型进行训练以及测试。
  • 用CRF做命名实体识别(二)主要是升级对上一篇升级,新添加了一些特征,着重介绍了如何生成组织名特征词这个特征。大家也许看的一知半解,进去读读便豁然开朗了
  • 用CRF做命名实体识别(三)主要是总结了所有特征的生成思路,并对它们做了一个效果对比

方法二:基于深度学习做命名实体识别

用深度学习做命名实体识别(附代码) 主要简单的介绍下BILSTM-CRF的原理,以及如何把大佬的数据集换成我们自己的数据集,进行训练。

二. 原理

原理的理解很不容易,这里主要推荐阅读书籍和博客。主读书籍,用博客来辅助理解

书籍推荐:吴军的《数学之美》,周志华的西瓜书《机器学习》,李航的《统计学习方法》

博客推荐:

1. CRF的原理介绍

如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别?

如何轻松愉快地理解条件随机场(CRF)?

2. HMM的原理介绍

一文搞懂HMM(隐马尔可夫模型) - skyme - 博客园

farewell:隐马尔科夫模型

如何用简单易懂的例子解释隐马尔可夫模型?

机器学习 --- 4. 大内密探HMM(隐马尔可夫)围捕赌场老千

如何用简单易懂的例子解释隐马尔可夫模型

3. BILSTM的原理介绍

推荐给初学LSTM或者懂个大概却不完全懂的人 - CSDN博客

三. 总结

中文的命名实体识别就到这里了,大家有疑问欢迎提出来一起探讨。另外要转载的话请联系我,谢谢各位了

欢迎扫码关注

posted @ 2018-09-12 20:46  炼己者  阅读(5795)  评论(0编辑  收藏  举报