会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
soyosuyang
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
5
6
7
8
9
10
11
12
13
···
18
下一页
2017年11月7日
聚类-----KMeans
摘要: 结果: + +| features|+ +|[5.1,3.5,1.4,0.2]||[4.9,3.0,1.4,0.2]||[4.7,3.2,1.3,0.2]||[4.6,3.1,1.5,0.2]||[5.0,3.6,1.4,0.2]||[5.4,3.9,1.7,0.4]||[4.6,3.4,1.4,0
阅读全文
posted @ 2017-11-07 16:02 soyosuyang
阅读(334)
评论(0)
推荐(0)
2017年11月6日
Spark 决策树--回归模型
摘要: 结果: + + + + + + +| features| label|indexedLabel| indexedFeatures|prediction|predictedLabel|+ + + + + + +|[4.6,3.1,1.5,0.2]|hadoop| 1.0|[4.6,3.1,1.5,0.
阅读全文
posted @ 2017-11-06 16:08 soyosuyang
阅读(1088)
评论(0)
推荐(0)
方差 标准差 均方误差 均方根误差
摘要: 方差:是每个样本值与全体样本值的平均数之差的平方值的平均数 标准差:是方差的算术平方根。标准差能反映一个数据集的离散程度 均方误差:对每一个样本,利用机器学习模型判定的类型与真实类型的差值的平方的平均数。(它是观测值与真值偏差的平方与观测次数n比值) 均方根误差(亦称标准误差):它是观测值与真值偏差
阅读全文
posted @ 2017-11-06 15:49 soyosuyang
阅读(1901)
评论(0)
推荐(0)
Spark 决策树--分类模型
摘要: 结果为: + + +| features| label|+ + +|[5.1,3.5,1.4,0.2]|hadoop||[4.9,3.0,1.4,0.2]|hadoop||[4.7,3.2,1.3,0.2]|hadoop||[4.6,3.1,1.5,0.2]|hadoop||[5.0,3.6,1.4
阅读全文
posted @ 2017-11-06 14:22 soyosuyang
阅读(529)
评论(0)
推荐(0)
2017年11月5日
回归和分类的区别
摘要: 分类模型和回归模型本质一样,分类模型是将回归模型的输出离散化。 举几个例子: 1. Logistic Regression 和 Linear Regression: Linear Regression: 输出一个标量 wx+b,这个值是连续值,所以可以用来处理回归问题。 Logistic Regre
阅读全文
posted @ 2017-11-05 16:30 soyosuyang
阅读(4736)
评论(0)
推荐(0)
Spark 多项式逻辑回归__多分类
摘要: 结果: + + + + + + + + +| features|label|indexedLabel| indexedFeatures| rawPrediction| probability|prediction|predictionLabel|+ + + + + + + + +|[4.4,3.2,
阅读全文
posted @ 2017-11-05 15:58 soyosuyang
阅读(2289)
评论(1)
推荐(0)
Spark 多项式逻辑回归__二分类
摘要: 结果: + + +| features|label|+ + +|[5.1,3.5,1.4,0.2]|soyo1||[4.9,3.0,1.4,0.2]|soyo1||[4.7,3.2,1.3,0.2]|soyo1||[4.6,3.1,1.5,0.2]|soyo1||[5.0,3.6,1.4,0.2]|
阅读全文
posted @ 2017-11-05 15:48 soyosuyang
阅读(675)
评论(0)
推荐(0)
Spark 二项逻辑回归__二分类
摘要: 结果: + + + + + + + + +|features |label|indexedLabel|indexedFeatures |rawPrediction |probability |prediction|predictionLabel|+ + + + + + + + +|[4.4,2.9,
阅读全文
posted @ 2017-11-05 15:46 soyosuyang
阅读(1342)
评论(0)
推荐(0)
数据仓库 VS 数据库
摘要: 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 (1) 面向主题:指数据仓库中的数据是按照一定的主题域进行组织。
阅读全文
posted @ 2017-11-05 10:15 soyosuyang
阅读(269)
评论(0)
推荐(0)
2017年11月4日
准确率,精确率,召回率,F-measure 之间的关系
摘要: 总结:(图上 R的计算的分母应该是 :40+10 )(笔误) 模型条件放宽,负类被误判为正类的可能性就变大(即FP变大)精确率和准确率会受影响(变小) 模型条件变严格,正类有可能被误判为负类(即FN变大)召回率会变小 F-measure是一种统计量,F-Measure又称为F-Score,F-Mea
阅读全文
posted @ 2017-11-04 10:33 soyosuyang
阅读(1731)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
18
下一页
公告