ptyhon中文本挖掘精简版
摘要:import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i...
阅读全文
posted @
2018-07-23 12:25
蔡军帅
阅读(181)
推荐(0)
[python] 使用scikit-learn工具计算文本TF-IDF值
摘要:在文本聚类、文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算。这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn。 希望文章对你有所帮助,相关文章如下: [python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒 Python
阅读全文
posted @
2018-07-23 11:06
蔡军帅
阅读(2031)
推荐(0)
python高手的自修课
摘要:目录 0.第0课:前言与参考文献 目标读者: 具有一定python基础的编程爱好者。 本系列博文为了尽可能少说废话,凡是能够用代码表达的,都尽量直接用代码。读者可以运行相应的代码来理解python的一些细节和技巧。 参考文献 本系列博文主要内容是对一系列博主阅读过的书籍、博客的总结和概括。其中蓝本是
阅读全文
posted @
2018-07-23 10:51
蔡军帅
阅读(380)
推荐(0)
sklearn: TfidfVectorizer 中文处理及一些使用参数
摘要:TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如: https://blog.csdn.net/blmoistawinde/article/details/80816179
阅读全文
posted @
2018-07-22 22:40
蔡军帅
阅读(5593)
推荐(0)
python在文件中输入整数
摘要:a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) a.append(int(test_set.label[i][0])) f=open('F:/goverment/ArticleMining/predict.txt'...
阅读全文
posted @
2018-07-22 15:28
蔡军帅
阅读(1926)
推荐(0)
Python文件操作,with open as追加文本内容实例
摘要:最常见的读写操作 就这样就完成了文件的写操错(此处用with的格式,可以节省很多不必要的麻烦) 读操作同理,只是做一下微小的变化处理而已 一些正则表达式的关键词 w:以写方式打开, w:以写方式打开, a:以追加模式打开 (从 EOF 开始, 必要时创建新文件) a:以追加模式打开 (从 EOF 开
阅读全文
posted @
2018-07-22 11:31
蔡军帅
阅读(528)
推荐(0)
Python中的Bunch模式
摘要:引用: 当树这样的数据结构被原型化(或者乃至于被定型)时,它往往会时一个非常有用而灵活的类型,允许我们在其构造器中设置任何属性。在这些情况下,我们会需要用到一种叫做“Bunch”的设计模式。 由于这个类直接继承dict类,所以我们可以自然而然地获得dict类地大量功能,比如对键/值的遍历,或者简单查
阅读全文
posted @
2018-07-22 11:22
蔡军帅
阅读(479)
推荐(0)
python文本挖掘模版
摘要:import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i...
阅读全文
posted @
2018-07-22 10:21
蔡军帅
阅读(1817)
推荐(0)
python多标签分类模版
摘要:1 from sklearn.multioutput import MultiOutputClassifier 2 from sklearn.ensemble import RandomForestClassifier 3 from sklearn.ensemble import ExtraTreesClassifier 4 import numpy as np 5 from...
阅读全文
posted @
2018-07-15 22:40
蔡军帅
阅读(4432)
推荐(0)
Win10 TensorFlow(gpu)安装详解
摘要:Win10 TensorFlow(gpu)安装详解 写在前面:TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从图象的一端流动到另一端
阅读全文
posted @
2018-07-06 13:18
蔡军帅
阅读(6537)
推荐(0)
python(ValueError: invalid literal for int() with base 10: 'abc' ‘1.0‘’’)强制类型转换
摘要:int()函数只能转化数字组成的字符串,看例子: 另一种把小数转成整数 异常出现的直接原因即是,对于一个浮点数的字符('1.4'),直接使用 int 进行强制类型转换: 也即,使用 int 对一个字符类型的数据进行强制类型转换,要求改字符类型只能为整数,不能为浮点数。 所以一种稳妥的做法: 显然,我
阅读全文
posted @
2018-06-05 21:17
蔡军帅
阅读(1059)
推荐(0)