随笔分类 -  机器学习基石

台大林轩田课程,坚持。
摘要:预先导入库 from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatures import matplotlib.pyplot as plt import nu 阅读全文
posted @ 2019-07-24 00:02 小王点点 阅读(540) 评论(0) 推荐(0)
摘要:算法梗概 The k-means algorithm is one of the simplest yet most popular machine learning algorithms. It takes in the data points and the number of clusters 阅读全文
posted @ 2019-04-03 00:28 小王点点 阅读(264) 评论(0) 推荐(0)
摘要:引言 假设今天希望将机器学习应用到医院中去,比如对于某一个患了心脏病的病人,求他3个月之后病危的概率。那么我们该选择哪一个模型,或者可以尝试已经学过的线性回归? 但是很遗憾的是,如果我们要利用线性回归,我们收集到的资料中应当包含病人3个月后病危的概率。这在实际中是很难得到的,因为对于一个患病的病人, 阅读全文
posted @ 2019-03-12 23:28 小王点点 阅读(7299) 评论(2) 推荐(0)
摘要:如何构建决策树 1. 准备工作: 1. 明确自变量和因变量 2. 确定信息度量的方式 3. 确定终止条件 2. 选择特征 1. 得到当前待处理子集 2. 计算所有特征信息度量 3. 得到当前最佳分类特征 3. 创建分支 根据选中特征将当前记录分成不同分支,分支个数取决于算法 4. 是否终止 判断是否 阅读全文
posted @ 2019-02-21 15:34 小王点点 阅读(419) 评论(0) 推荐(0)
摘要:“知错能改”算法梗概: 目标:w1x1+w2x2=0是一条经过原点的直线,找到合适的参数w1,w2使得该直线的较好的区分两组数据 1. 随机初始化参数w1,w2. 之前的法向量为(w1, w2) 2. 开始迭代: 当对某一个数据错误的分类后,对两个参数w1, w2进行更新,(w1, w2).T是直线 阅读全文
posted @ 2019-02-19 13:30 小王点点 阅读(260) 评论(0) 推荐(0)