12 2018 档案

摘要:一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 二、中文文本分类 按学号未位 阅读全文
posted @ 2018-12-17 11:38 陈松林 阅读(219) 评论(0) 推荐(0)
摘要:1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 4. 阅读全文
posted @ 2018-12-10 11:19 陈松林 阅读(129) 评论(0) 推荐(0)
摘要:from sklearn.datasets import load_boston boston = load_boston() print(boston.keys()) data = boston.data x = data[:,5] y = boston.target import matplotlib.pyplot as plt plt.scatter(x,y) plt.plot(x,9... 阅读全文
posted @ 2018-12-10 09:12 陈松林 阅读(223) 评论(0) 推荐(0)
摘要:1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 19:03 陈松林 阅读(218) 评论(0) 推荐(0)
摘要:1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-03 11:23 陈松林 阅读(144) 评论(0) 推荐(0)
摘要:import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer import csv import numpy as np from sklearn.model_selection import train_test_split from sklearn.feature_extractio... 阅读全文
posted @ 2018-12-03 11:05 陈松林 阅读(260) 评论(0) 推荐(0)