文章分类 - 数据科学
机器学习
摘要:https://blog.csdn.net/kun_csdn/article/details/88919091 k-近邻算法是一个有监督的机器学习算法,k-近邻算法也被称为knn算法,可以解决分类问题。也可以解决回归问题。本文主要内容整理为如下: knn算法的原理、优缺点及参数k取值对算法性能的影响
阅读全文
摘要:前几天和德川一起在学习会上讲解了k-NN算法,这里进行总结一下,力争用最通俗的语言讲解以便有利于更多同学的理解。 本文目录如下: 1.k近邻算法的基本概念,原理以及应用 2.k近邻算法中k的选取,距离的度量以及特征归一化的必要性 3.k近邻法的实现:kd树原理的讲解 4.kd树详细例子讲解 5.kd
阅读全文
摘要:### Step1:库函数导入 from sklearn.model_selection import train_test_split #测试集占总数据中的30%, 设置随机状态,方便后续复现本次的随机切分 X_train, X_test, y_train, y_test = train_test
阅读全文
摘要:作者:谢科链接:https://www.zhihu.com/question/21592677/answer/24663656来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 "Data Science = statistics who uses python and
阅读全文
摘要:一、线性回归 相关系数 两个变量每单位的相关性程度 from collections import OrderedDict import pandas as pd # 数据集 examDict={ '学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.2
阅读全文
摘要:回归是确定因变量和一组自变量之间的关系的过程。线性模型形式简单、易于建模,但却蕴含着机器学习中一些重要的基本思想。本文会通过EXCEL构建一个多元线性回归模型,来预测广告投入对销售的影响。本文的主要内容包括: 线性回归的基本概念 回归模型的重要参数 多元线性回归模型案例 谁发明了最小二乘法 线性回归
阅读全文
摘要:1. 背景 最近在拍沪牌,毫无经验,想着本也是做数据的,来个预测。从各大网站搜索沪牌近6个月最后30s的数据。 2. 原理 参考文章: 最小二乘法 http://blog.csdn.net/yang6464158/article/details/24477547 机器学习经典算法之—–最小二乘法 h
阅读全文
浙公网安备 33010602011771号