会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
黎明程序员
博客园
首页
联系
管理
订阅
上一页
1
···
5
6
7
8
9
10
11
下一页
2017年12月9日
【Spark机器学习速成宝典】模型篇08支持向量机【SVM】(Python版)
摘要: 目录 什么是支持向量机(SVM) 线性可分数据集的分类 线性可分数据集的分类(对偶形式) 线性近似可分数据集的分类 线性近似可分数据集的分类(对偶形式) 非线性数据集的分类 SMO算法 合页损失函数 Python代码(sklearn库) 什么是支持向量机(SVM) 引例 假定有训练数据集,其中,x是
阅读全文
posted @ 2017-12-09 15:23 黎明程序员
阅读(1496)
评论(0)
推荐(0)
2017年12月8日
【Spark机器学习速成宝典】模型篇01支持向量机【SVM】(Python版)
摘要: 目录 支持向量机原理 支持向量机代码(Spark Python) 支持向量机原理 详见博文:http://www.cnblogs.com/itmorn/p/8011587.html 返回目录 支持向量机代码(Spark Python) 代码里数据:https://pan.baidu.com/s/1j
阅读全文
posted @ 2017-12-08 17:40 黎明程序员
阅读(1909)
评论(0)
推荐(0)
【Spark机器学习速成宝典】基础篇04数据类型(Python版)
摘要: 目录 Vector LabeledPoint Matrix 使用C4.5算法生成决策树 使用CART算法生成决策树 预剪枝和后剪枝 应用:遇到连续与缺失值怎么办? 多变量决策树 Python代码(sklearn库) Vector 一个数学向量。MLlib 既支持稠密向量也支持稀疏向量,前者表示向量的
阅读全文
posted @ 2017-12-08 11:43 黎明程序员
阅读(850)
评论(0)
推荐(0)
2017年12月7日
【Spark机器学习速成宝典】基础篇03数据读取与保存(Python版)
摘要: 目录 保存为文本文件:saveAsTextFile 保存为json:saveAsTextFile 保存为SequenceFile:saveAsSequenceFile 读取hive 保存为文本文件:saveAsTextFile 返回目录 保存为json:saveAsTextFile 返回目录 保存为
阅读全文
posted @ 2017-12-07 15:01 黎明程序员
阅读(1249)
评论(0)
推荐(1)
2017年12月6日
【Spark机器学习速成宝典】基础篇02RDD常见的操作(Python版)
摘要: 目录 引例入门:textFile、collect、filter、first、persist、count 创建RDD的方式:parallelize、textFile 转化操作:map、filter、flatMap、sample、union、intersection、subtract、cartesian
阅读全文
posted @ 2017-12-06 16:41 黎明程序员
阅读(1596)
评论(1)
推荐(0)
2017年12月1日
【Spark机器学习速成宝典】基础篇01Windows下spark开发环境搭建(Python版)
摘要: 目录 安装jdk 安装eclipse 安装PyDev插件 配置Spark 配置Hadoop Python代码 配置Spark 下载Spark http://spark.apache.org/downloads.html 配置环境变量 变量名:SPARK_HOME 变量值:D:\spark (不能有空
阅读全文
posted @ 2017-12-01 16:12 黎明程序员
阅读(1220)
评论(0)
推荐(1)
2017年11月29日
【机器学习速成宝典】模型篇06决策树【ID3、C4.5、CART】(Python版)
摘要: 目录 什么是决策树(Decision Tree) 特征选择 使用ID3算法生成决策树 使用C4.5算法生成决策树 使用CART算法生成决策树 预剪枝和后剪枝 应用:遇到连续与缺失值怎么办? 多变量决策树 Python代码(sklearn库) 什么是决策树(Decision Tree) 引例 现有训练
阅读全文
posted @ 2017-11-29 10:10 黎明程序员
阅读(7773)
评论(0)
推荐(0)
2017年11月27日
【机器学习速成宝典】模型篇05朴素贝叶斯【Naive Bayes】(Python版)
摘要: 目录 先验概率与后验概率 条件概率公式、全概率公式、贝叶斯公式 什么是朴素贝叶斯(Naive Bayes) 拉普拉斯平滑(Laplace Smoothing) 应用:遇到连续变量怎么办?(多项式分布,高斯分布) Python代码(sklearn库) 先验概率与后验概率 引例 想象有 A、B、C 三个
阅读全文
posted @ 2017-11-27 20:41 黎明程序员
阅读(6824)
评论(0)
推荐(0)
2017年11月26日
【机器学习速成宝典】模型篇04k近邻法【kNN】(Python版)
摘要: 目录 什么是k近邻算法 模型的三个基本要素 构造kd树 kd树的最近邻搜索 kd树的k近邻搜索 Python代码(sklearn库) 什么是K近邻算法(k-Nearest Neighbor,kNN) 引例 假设有数据集,其中前6部是训练集(有属性值和标记),我们根据训练集训练一个KNN模型,预测最后
阅读全文
posted @ 2017-11-26 16:41 黎明程序员
阅读(3825)
评论(0)
推荐(0)
2017年11月24日
【机器学习速成宝典】模型篇03逻辑斯谛回归【Logistic回归】(Python版)
摘要: 目录 一元线性回归、多元线性回归、Logistic回归、广义线性回归、非线性回归的关系 什么是极大似然估计 逻辑斯谛回归(Logistic回归) 多类分类Logistic回归 Python代码(sklearn库) 一元线性回归、多元线性回归、逻辑斯谛回归、广义线性回归、非线性回归的关系 通过上图(插
阅读全文
posted @ 2017-11-24 14:27 黎明程序员
阅读(5104)
评论(0)
推荐(1)
上一页
1
···
5
6
7
8
9
10
11
下一页
公告