上一页 1 ··· 92 93 94 95 96 97 98 99 100 ··· 164 下一页
  2018年7月24日
摘要: print(train_set.tdm) print(type(train_set.tdm))输出得到: (0, 3200) 0.264940780338 (0, 1682) ... 阅读全文
posted @ 2018-07-24 19:41 蔡军帅 阅读(259) 评论(0) 推荐(0)
  2018年7月23日
摘要: 1.生成随机稀疏矩阵:scipy中生成随机稀疏矩阵的函数如下:scipy.sparse.rand(m,n,density,format,dtype,random_state)1参数介绍:参数含义m,n整型... 阅读全文
posted @ 2018-07-23 23:43 蔡军帅 阅读(278) 评论(0) 推荐(0)
摘要: 1.生成随机稀疏矩阵: scipy中生成随机稀疏矩阵的函数如下: 1 参数介绍: 例子 代码如下: 2.稀疏矩阵的操作: 输出结果如下: 注:更多参考请查看docs.scipy.org 阅读全文
posted @ 2018-07-23 23:43 蔡军帅 阅读(5514) 评论(0) 推荐(0)
摘要: import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文
posted @ 2018-07-23 12:25 蔡军帅 阅读(180) 评论(0) 推荐(0)
摘要: import xlrdimport jiebaimport sys import importlibimport os #python内置的包,用于进行文件目录操作,我们将会用到os.listd... 阅读全文
posted @ 2018-07-23 12:25 蔡军帅 阅读(115) 评论(0) 推荐(0)
摘要: 在文本聚类、文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn。 希望文章对你有所帮... 阅读全文
posted @ 2018-07-23 11:06 蔡军帅 阅读(231) 评论(0) 推荐(0)
摘要: 在文本聚类、文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn。 希望文章对你有所帮助,相关文章如下: [python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒 Python 阅读全文
posted @ 2018-07-23 11:06 蔡军帅 阅读(2030) 评论(0) 推荐(0)
摘要: 目录 0.第0课:前言与参考文献 目标读者: 具有一定python基础的编程爱好者。 本系列博文为了尽可能少说废话,凡是能够用代码表达的,都尽量直接用代码。读者可以运行相应的代码来理解python的一些细节和技巧。 参考文献 本系列博文主要内容是对一系列博主阅读过的书籍、博客的总结和概括。其中蓝本是 阅读全文
posted @ 2018-07-23 10:51 蔡军帅 阅读(380) 评论(0) 推荐(0)
摘要: python高手的自修课 作者:相国大人 目录0.第0课:前言与参考文献 目标读者: 具有一定python基础的编程爱好者。本系列博文为了尽可能少说废话,凡是能够用代码表达的,都尽量直接用代码。读者可... 阅读全文
posted @ 2018-07-23 10:51 蔡军帅 阅读(97) 评论(0) 推荐(0)
  2018年7月22日
摘要: TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如:#coding=utf-8from sklea... 阅读全文
posted @ 2018-07-22 22:40 蔡军帅 阅读(162) 评论(0) 推荐(0)
上一页 1 ··· 92 93 94 95 96 97 98 99 100 ··· 164 下一页