随笔分类 -  博雅数据

摘要:博雅数据机器学习10 贝叶斯定理 ## 计算队1获胜的概率prob_win_1 prob_win_1 = 1 - prob_win_0 ## 计算队1取胜时队0是东道主的概率 prob_win_1_home_0 = 1 - prob_win_1_home_1 ## 计算队0取胜时队0是东道主的概率 阅读全文
posted @ 2021-02-04 06:36 城南漠北 阅读(134) 评论(0) 推荐(0)
摘要:博雅数据机器学习09 K近邻算法 ## 声明储存K个邻居的index的列表 index_list = [] ## 遍历每个测试样本的与训练集的举例,item类型为dict for item in distances: ## item的类型为dict,即{'index': distance} ## 使 阅读全文
posted @ 2021-02-03 06:35 城南漠北 阅读(145) 评论(0) 推荐(0)
摘要:博雅数据机器学习08 PCA降维 from sklearn.decomposition import PCA import matplotlib.pyplot as plt %matplotlib inline # pca降维过程 pca = PCA(n_components=2) X_pca = 阅读全文
posted @ 2021-02-02 06:34 城南漠北 阅读(151) 评论(0) 推荐(0)
摘要:博雅数据机器学习07 PCA算法 import pandas as pd import numpy as np from numpy import linalg as LA # 读取数据 iris = pd.read_csv('iris.csv', usecols=range(4)) # 定义主成分 阅读全文
posted @ 2021-02-01 06:33 城南漠北 阅读(232) 评论(0) 推荐(0)
摘要:博雅数据机器学习06 线性回归 from sklearn import linear_model from numpy import mat, array, mean # 根据X和y训练模型并计算预测值y_pred X = insurance.drop(['charges'], axis=1) y 阅读全文
posted @ 2021-01-31 06:32 城南漠北 阅读(187) 评论(0) 推荐(0)
摘要:博雅数据机器学习05 多元线性回归 from sklearn import linear_model from numpy import mat, linalg, column_stack, ones import pandas as pd insurance = pd.read_csv('insu 阅读全文
posted @ 2021-01-30 06:31 城南漠北 阅读(93) 评论(0) 推荐(0)
摘要:博雅数据机器学习04 线性回归 一元线性回归 import pandas as pd from sklearn import linear_model insurance = pd.read_csv('insurance.csv') age = insurance['age'].values cha 阅读全文
posted @ 2021-01-29 06:30 城南漠北 阅读(113) 评论(0) 推荐(0)
摘要:博雅数据机器学习03 特征离散化 import pandas as pd data = pd.read_csv('user_review.csv') # 请在下方作答 # import pandas as pd ## 返回bins bins = pd.qcut(data['Member years' 阅读全文
posted @ 2021-01-28 06:28 城南漠北 阅读(83) 评论(0) 推荐(0)
摘要:博雅数据机器学习02 特征标准化 import pandas as pd data = pd.read_csv('user_review.csv') # 请在下方作答 # def min_max(data): ## 最小值 data_min = data.min() ## 最大值 data_max 阅读全文
posted @ 2021-01-27 06:27 城南漠北 阅读(99) 评论(0) 推荐(0)