摘要: #导入os包加载数据目录 import os path = r'G:\英雄时刻\258' #停词库 with open(r'G:\英雄时刻\stopsCN.txt', encoding='utf-8') as f: stopwords = f.read().split('\n') #对数据进行标准编码处理(encoding='utf-8') import codecs import... 阅读全文
posted @ 2018-12-20 18:24 无名之辈qaq 阅读(147) 评论(0) 推荐(0) 编辑
摘要: boston.keys() print(boston.DESCR) boston.data.shape boston.feature_names boston.target import pandas as pd df = pd.DataFrame(boston.data) df #1.导入boston房价数据集 from sklearn.datasets import load_b... 阅读全文
posted @ 2018-12-10 11:04 无名之辈qaq 阅读(133) 评论(0) 推荐(0) 编辑
摘要: import csv # 读数据 file_path = r'EmailData.txt' EmailData = open(file_path,'r',encoding='utf-8') Email_data = [] Email_target = [] csv_reader = csv.reader(EmailData,delimiter='\t') for line in csv_read... 阅读全文
posted @ 2018-12-03 11:09 无名之辈qaq 阅读(166) 评论(0) 推荐(0) 编辑
摘要: import numpy as np from sklearn.naive_bayes import GaussianNB from sklearn.datasets import load_iris iris=load_iris() NB_model=GaussianNB() pre=NB_model.fit(iris.data,iris.target) Y_pre=pre.predict(i... 阅读全文
posted @ 2018-11-26 11:16 无名之辈qaq 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 1.简述分类与聚类的联系与区别? 分类是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确 阅读全文
posted @ 2018-11-19 20:05 无名之辈qaq 阅读(164) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np china = load_sample_image("china.jpg") plt.imshow(china) plt.show... 阅读全文
posted @ 2018-11-12 11:01 无名之辈qaq 阅读(119) 评论(0) 推荐(0) 编辑
摘要: import numpy as np a=np.random.randn(4,4) #4行4列的正态分布随机数组 print(a) import numpy as np mu = 10 #期望为10 sigma = 30 #标准差为30 num = 100 #个数为100 rand_data = np.random.normal(mu, sigma, num) print(ran... 阅读全文
posted @ 2018-11-05 11:37 无名之辈qaq 阅读(171) 评论(0) 推荐(0) 编辑
摘要: import numpy from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集中读出鸢尾花数据集data iris_data = load_iris() # 3.查看data类型,包含哪些数据 print("数据类型: ", type(iris_data)) print("包含数据: ", iris_data.keys()) ... 阅读全文
posted @ 2018-10-29 11:33 无名之辈qaq 阅读(331) 评论(0) 推荐(0) 编辑
摘要: def pySum(n):... #print pySum(10)) import numpy def npSum(n):... #print npSum(10)) from datetime import datetime start = datetime.now() pySum(1000000) delta = datetime.now()-start import numpy nu... 阅读全文
posted @ 2018-10-22 11:34 无名之辈qaq 阅读(153) 评论(1) 推荐(0) 编辑
摘要: strHello='''...'''.lower() fo = open('C:\\Users\Administrator\Desktop\hello.txt', 'r', encoding='utf-8') hello = fo.read() fo.close() print(hello) sep = ''',?''' for ch in sep: strHello = strHell... 阅读全文
posted @ 2018-10-15 11:23 无名之辈qaq 阅读(251) 评论(0) 推荐(0) 编辑