随笔分类 -  【自然语言处理】 基础

摘要:内容简介代码一,笔记简略版本代码二,词频统计与pandas集合,分词词性提取与词频统计结合代码一import FontCN_NLPtools as fts引用的是我自己写的一个类,是对我常用的一些方法的封装,code已经上传# - * - coding: utf - ... 阅读全文
posted @ 2017-07-29 21:28 FontTian 阅读(502) 评论(0) 推荐(0)
摘要:内容简介代码一,笔记简略版本代码二,词频统计与pandas集合,分词词性提取与词频统计结合代码一import FontCN_NLPtools as fts引用的是我自己写的一个类,是对我常用的一些方法的封装,code已经上传# - * - coding: utf - 8 -*-## ... 阅读全文
posted @ 2017-07-29 21:27 FontTian 阅读(1689) 评论(0) 推荐(0)
摘要:背景在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个任务,如果你没有NLPIR那么你可以参考这篇文章NLPIR快速搭建,或... 阅读全文
posted @ 2017-07-29 00:24 FontTian 阅读(440) 评论(0) 推荐(0)
摘要:背景在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个任务,如果你没有NLPIR那么你可以参考这篇文章NLPIR快速搭建,或者直接下载我已经... 阅读全文
posted @ 2017-07-29 00:24 FontTian 阅读(509) 评论(0) 推荐(0)
摘要:前叙该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图背景在进行汉语自然语言处理时候,经常使用的几个方法,分词,清除停用词,以及获取新词,为了方便使用我们将其封装. 这样我们就可以通过一行简单的... 阅读全文
posted @ 2017-07-28 23:40 FontTian 阅读(822) 评论(0) 推荐(0)
摘要:前叙该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图背景在进行汉语自然语言处理时候,经常使用的几个方法,分词,清除停用词,以及获取新词,为了方便使用我们将其封装. 这样我们就可... 阅读全文
posted @ 2017-07-28 23:40 FontTian 阅读(289) 评论(0) 推荐(0)
摘要:Python Windows10汉语自然语言处理基本组件: 201707032018/01/16:Github长期更新,Windows,Linux通用 阅读全文
posted @ 2017-07-03 15:23 FontTian 阅读(128) 评论(0) 推荐(0)
摘要:Python Windows10汉语自然语言处理基本组件: 20170703 阅读全文
posted @ 2017-07-03 15:22 FontTian 阅读(194) 评论(0) 推荐(0)
摘要:文章简介与更新记录如果你只想获取中文停用词此表,请直接到文章结尾下载项目文件,其中包括三个中文停用词词表,一个英文停用词词表和一个合并词表的.py文件2017/07/04 创建文章,上传文件2017/07/04 更新了合并代码,添加了新的中文停用词表(哈工大扩展版本)和一个新的停用词... 阅读全文
posted @ 2017-07-03 15:13 FontTian 阅读(1964) 评论(0) 推荐(0)
摘要:文章简介与更新记录如果你只想获取中文停用词此表,请直接到文章结尾下载项目文件,其中包括三个中文停用词词表,一个英文停用词词表和一个合并词表的.py文件2017/07/04 创建文章,上传文件2017/07/04 更新了合并代码,添加了新的中文停用词表(哈工大扩展版本)... 阅读全文
posted @ 2017-07-03 15:13 FontTian 阅读(535) 评论(0) 推荐(0)
摘要:在我们的日常聊天中,情景才是最重要的。我们将使用 TensorFlow 构建一个聊天机器人框架,并且添加一些上下文处理机制来使得机器人更加智能。“Whole World in your Hand” — Betty Newman-Maguire (http://www.... 阅读全文
posted @ 2017-07-02 23:35 FontTian 阅读(320) 评论(0) 推荐(0)
摘要:在我们的日常聊天中,情景才是最重要的。我们将使用 TensorFlow 构建一个聊天机器人框架,并且添加一些上下文处理机制来使得机器人更加智能。“Whole World in your Hand” — Betty Newman-Maguire (http://www.bettynewmanmagui... 阅读全文
posted @ 2017-07-02 23:34 FontTian 阅读(415) 评论(0) 推荐(0)
摘要:前叙利用下面的代码你将可以将任意中文文本生成词云,其分词部分由jieba,NLPIR2016两个部分组成,生成词语由worldcloud负责,默认会自动发现文本中的20个新词并添加到词库中,当然你也可以手动添加或者通过txt添加用户词库.code中已经有十分详细的设置... 阅读全文
posted @ 2017-06-10 15:21 FontTian 阅读(369) 评论(0) 推荐(0)
摘要:前叙利用下面的代码你将可以将任意中文文本生成词云,其分词部分由jieba,NLPIR2016两个部分组成,生成词语由worldcloud负责,默认会自动发现文本中的20个新词并添加到词库中,当然你也可以手动添加或者通过txt添加用户词库.code中已经有十分详细的设置说明与代码解释,... 阅读全文
posted @ 2017-06-10 15:20 FontTian 阅读(2066) 评论(0) 推荐(0)
摘要:前叙该博文继承之前的文章,进一步介绍NLPIR2016的使用,三个内容(利用NLPIR 的发现新词功能自动提取文本内的新词汇,解决worldcloud中英文混合只显示中文的问题,NLPIR与worldcloud结合生成词云) 写作本博客需要一个小时,阅读需要十二分钟.... 阅读全文
posted @ 2017-06-10 15:06 FontTian 阅读(192) 评论(0) 推荐(0)
摘要:前叙该博文继承之前的文章,进一步介绍NLPIR2016的使用,三个内容(利用NLPIR 的发现新词功能自动提取文本内的新词汇,解决worldcloud中英文混合只显示中文的问题,NLPIR与worldcloud结合生成词云) 写作本博客需要一个小时,阅读需要十二分钟.使用 NLPIR... 阅读全文
posted @ 2017-06-10 15:06 FontTian 阅读(327) 评论(0) 推荐(0)
摘要:前叙博主写这篇文章使用了八十分钟,阅读需要十五分钟,读完之后你将会学会在Python中使用NLPIR2016.如果你花费更多的时间练习后半部分的例子,你将能够在一天内学会在Python中使用NLPIR2016的全部所需知识 如果你想要获取更详细的API翻译,你需要进一步学习ctype... 阅读全文
posted @ 2017-06-06 17:16 FontTian 阅读(4290) 评论(0) 推荐(0)
摘要:前叙博主写这篇文章使用了八十分钟,阅读需要十五分钟,读完之后你将会学会在Python中使用NLPIR2016.如果你花费更多的时间练习后半部分的例子,你将能够在一天内学会在Python中使用NLPIR2016的全部所需知识 如果你想要获取更详细的API翻译,你需要进一... 阅读全文
posted @ 2017-06-06 17:16 FontTian 阅读(396) 评论(0) 推荐(0)
摘要:决定上传我平时写的部分源码,不过暂时只打算上传有关NLP的部分,之后随着博客的不断更新,我也会不断更新这篇博客,你可以将这片博客放在你的收藏夹里,这样方便你的浏览1.关于NLPIR的部分20160606,第一次上传测试pynlpir在Python中使用NLPIR201... 阅读全文
posted @ 2017-06-06 17:14 FontTian 阅读(117) 评论(0) 推荐(0)
摘要:决定上传我平时写的部分源码,不过暂时只打算上传有关NLP的部分,之后随着博客的不断更新,我也会不断更新这篇博客,你可以将这片博客放在你的收藏夹里,这样方便你的浏览1.关于NLPIR的部分20160606,第一次上传测试pynlpir在Python中使用NLPIR2016(快速上手与完全掌握)百度云链... 阅读全文
posted @ 2017-06-06 17:13 FontTian 阅读(176) 评论(0) 推荐(0)