摘要:
2.新闻文本分类: 阅读全文
摘要:
[9.10210898] -34.670620776438554 import matplotlib.pyplot as plt x = boston.data[:,5] #第五个因素与房价的关系 y = boston.target plt.figure(figsize=(10,6))#图形大小 p 阅读全文
摘要:
#1. 数据准备:收集数据与读取 #2. 数据预处理:处理数据 #3. 训练集与测试集:将先验数据按一定比例进行拆分。 #4. 提取数据特征,将文本解析为词向量 。 #5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 阅读全文
摘要:
150 100 150 7 Accuray:0.953 Accuray:0.953 Accuray:0.953 阅读全文
摘要:
#查看图片大小 import sys print(sys.getsizeof(china)) #原图片 print(sys.getsizeof(new_image)) #新图片 819968 128 #原始图片与新图片保存成文件,观察文件的大小。 #理解贝叶斯定理: #M桶:7红3黄 #N桶:1红9 阅读全文
摘要:
[3.7586666666666662, 1.3999999999999999, 1.3] True [3.7586666666666662, 3.7586666666666662, 1.3] True [3.7586666666666662, 3.7586666666666662, 3.75866 阅读全文
摘要:
[ 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 1.5 1.6 1.4 1.1 1.2 1.5 1.3 1.4 1.7 1.5 1.7 1.5 1. 1.7 1.9 1.6 1.6 1.5 1.4 1.6 1.6 1.5 1.5 1.4 1.5 1.2 1.3 1 阅读全文
摘要:
#1.导入鸢尾花数据 from sklearn.datasets import load_iris #导入numpy import numpy as np #2. 从sklearn包自带的数据集中读出鸢尾花数据集data data_iris = load_iris() data_iris #3.查看data类型,包含哪些数据 type_data=type(data_iris) #... 阅读全文
摘要:
#列表+循环实现,并包装成函数 import numpy def numpy(n): a = list(range(n)) b = list(range(0,10*n,5)) c = [] for i in range(len(a)): c.append(a[i]**2+b[i]**3) retur 阅读全文
摘要:
#英文统计词频 fo = open('yingwen.txt', 'r', encoding='utf-8') str = fo.read() #通过文件读取字符串 str fo.close() print(str) ##预处理标点符号 str = str.replace('.','') print(str) ##预处理特殊字符 sep = '.,:'';?!-_' for ch in ... 阅读全文