2016年12月28日

郑捷《机器学习算法原理与编程实践》学习笔记(第二章 中文文本分类(一))

摘要: 2.1 文本挖掘与文本分类的概念 文本挖掘是指从大量的文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好的组织信息以便将来参考。 搜索和信息检索(IR):存储和文本文档的检索,包括搜索引擎个关键字搜索 文本聚类:使用聚类方法,对词汇、片段、段落或文件进行分组和归类 文本分 阅读全文

posted @ 2016-12-28 22:08 金秀 阅读(2634) 评论(0) 推荐(2)

Python随机森林算法的使用

摘要: #coding:utf-8 # from python.Lib.packages.sklearn.tree import DecisionTreeClassifier # from python.Lib.packages.matplotlib.pyplot import * # from python.Lib.packages.sklearn.cross_validation import t... 阅读全文

posted @ 2016-12-28 11:08 金秀 阅读(891) 评论(0) 推荐(1)

导航