摘要:
TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如: https://blog.csdn.net/blmoistawinde/article/details/80816179 阅读全文
posted @ 2018-07-22 22:40
蔡军帅
阅读(5593)
评论(0)
推荐(0)
摘要:
a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) a.append(int(test_set.label[i][0])) f=open('F:/goverment/ArticleMining/predict.txt'... 阅读全文
posted @ 2018-07-22 15:28
蔡军帅
阅读(1926)
评论(0)
推荐(0)
摘要:
a=[] b=[] for i in range(len(predicted)): b.append((int)(float(predicted[i]))) ... 阅读全文
posted @ 2018-07-22 15:28
蔡军帅
阅读(150)
评论(0)
推荐(0)
摘要:
最常见的读写操作import rewith open('/Users/Mr.Long/Desktop/data.txt', 'w') as f: f.write('hello world')就这样就完... 阅读全文
posted @ 2018-07-22 11:31
蔡军帅
阅读(1523)
评论(0)
推荐(0)
摘要:
最常见的读写操作 就这样就完成了文件的写操错(此处用with的格式,可以节省很多不必要的麻烦) 读操作同理,只是做一下微小的变化处理而已 一些正则表达式的关键词 w:以写方式打开, w:以写方式打开, a:以追加模式打开 (从 EOF 开始, 必要时创建新文件) a:以追加模式打开 (从 EOF 开 阅读全文
posted @ 2018-07-22 11:31
蔡军帅
阅读(528)
评论(0)
推荐(0)
摘要:
引用: 当树这样的数据结构被原型化(或者乃至于被定型)时,它往往会时一个非常有用而灵活的类型,允许我们在其构造器中设置任何属性。在这些情况下,我们会需要用到一种叫做“Bunch”的设计模式。 由于这个类直接继承dict类,所以我们可以自然而然地获得dict类地大量功能,比如对键/值的遍历,或者简单查 阅读全文
posted @ 2018-07-22 11:22
蔡军帅
阅读(479)
评论(0)
推荐(0)
摘要:
引用: 当树这样的数据结构被原型化(或者乃至于被定型)时,它往往会时一个非常有用而灵活的类型,允许我们在其构造器中设置任何属性。在这些情况下,我们会需要用到一种叫做“Bunch”的设计模式。... 阅读全文
posted @ 2018-07-22 11:22
蔡军帅
阅读(745)
评论(0)
推荐(0)
摘要:
import xlrdimport jiebaimport sys import importlibimport os #python内置的包,用于进行文件目录操作,我们将会用到os.listd... 阅读全文
posted @ 2018-07-22 10:21
蔡军帅
阅读(198)
评论(0)
推荐(0)
摘要:
import xlrd import jieba import sys import importlib import os #python内置的包,用于进行文件目录操作,我们将会用到os.listdir函数 import pickle #导入cPickle包并且取一个别名pickle #持久化类 import random import numpy as np i... 阅读全文
posted @ 2018-07-22 10:21
蔡军帅
阅读(1816)
评论(0)
推荐(0)
浙公网安备 33010602011771号