随笔分类 - 博雅数据
摘要:博雅数据机器学习10 贝叶斯定理 ## 计算队1获胜的概率prob_win_1 prob_win_1 = 1 - prob_win_0 ## 计算队1取胜时队0是东道主的概率 prob_win_1_home_0 = 1 - prob_win_1_home_1 ## 计算队0取胜时队0是东道主的概率
阅读全文
摘要:博雅数据机器学习09 K近邻算法 ## 声明储存K个邻居的index的列表 index_list = [] ## 遍历每个测试样本的与训练集的举例,item类型为dict for item in distances: ## item的类型为dict,即{'index': distance} ## 使
阅读全文
摘要:博雅数据机器学习08 PCA降维 from sklearn.decomposition import PCA import matplotlib.pyplot as plt %matplotlib inline # pca降维过程 pca = PCA(n_components=2) X_pca =
阅读全文
摘要:博雅数据机器学习07 PCA算法 import pandas as pd import numpy as np from numpy import linalg as LA # 读取数据 iris = pd.read_csv('iris.csv', usecols=range(4)) # 定义主成分
阅读全文
摘要:博雅数据机器学习06 线性回归 from sklearn import linear_model from numpy import mat, array, mean # 根据X和y训练模型并计算预测值y_pred X = insurance.drop(['charges'], axis=1) y
阅读全文
摘要:博雅数据机器学习05 多元线性回归 from sklearn import linear_model from numpy import mat, linalg, column_stack, ones import pandas as pd insurance = pd.read_csv('insu
阅读全文
摘要:博雅数据机器学习04 线性回归 一元线性回归 import pandas as pd from sklearn import linear_model insurance = pd.read_csv('insurance.csv') age = insurance['age'].values cha
阅读全文
摘要:博雅数据机器学习03 特征离散化 import pandas as pd data = pd.read_csv('user_review.csv') # 请在下方作答 # import pandas as pd ## 返回bins bins = pd.qcut(data['Member years'
阅读全文
摘要:博雅数据机器学习02 特征标准化 import pandas as pd data = pd.read_csv('user_review.csv') # 请在下方作答 # def min_max(data): ## 最小值 data_min = data.min() ## 最大值 data_max
阅读全文
浙公网安备 33010602011771号