上一页 1 ··· 206 207 208 209 210 211 212 213 214 ··· 273 下一页
摘要: Updated:use model broadcast, mappartition+flatmap,see: see: https://gist.github.com/lucidfrontier45/591be3eb78557d1844ca 一开始是因为没法直接在pyspark里使用map 来做mo 阅读全文
posted @ 2017-07-21 16:12 bonelee 阅读(3063) 评论(5) 推荐(0)
摘要: 从几何上讲,单高斯分布模型在二维空间应该近似于椭圆,在三维空间上近似于椭球。遗憾的是在很多分类问题中,属于同一类别的样本点并不满足“椭圆”分布的特性。这就引入了高斯混合模型。——可以认为是基本假设! 高斯混合模型Gaussian Mixture Model (GMM) 摘自:http://www.i 阅读全文
posted @ 2017-07-21 09:40 bonelee 阅读(11198) 评论(0) 推荐(0)
摘要: 关键参数 最重要的,常常需要调试以提高算法效果的有两个参数:numTrees,maxDepth。 numTrees(决策树的个数):增加决策树的个数会降低预测结果的方差,这样在测试时会有更高的accuracy。训练时间大致与numTrees呈线性增长关系。 maxDepth:是指森林中每一棵决策树最 阅读全文
posted @ 2017-07-19 09:46 bonelee 阅读(2285) 评论(0) 推荐(0)
摘要: 随机森林算法 由多个决策树构成的森林,算法分类结果由这些决策树投票得到,决策树在生成的过程当中分别在行方向和列方向上添加随机过程,行方向上构建决策树时采用放回抽样(bootstraping)得到训练数据,列方向上采用无放回随机抽样得到特征子集,并据此得到其最优切分点,这便是随机森林算法的基本原理。图 阅读全文
posted @ 2017-07-19 09:18 bonelee 阅读(9069) 评论(0) 推荐(0)
摘要: 你选择了:{{selectedName}} 点我! 该实例演示了 ng-options 指令的使用。 阅读全文
posted @ 2017-07-18 19:10 bonelee 阅读(294) 评论(0) 推荐(0)
摘要: 下面一文章就总结几点关键: 1、要学会观察,尤其是输入数据的特征提取时,看各输入数据和输出的关系,用绘图看! 2、训练后,看测试数据和训练数据误差,确定是否过拟合还是欠拟合; 3、欠拟合的话,说明模型不准确或者特征提取不够,对于特征提取不够问题,可以根据模型的反馈来看其和数据的相关性,如果相关系数是 阅读全文
posted @ 2017-07-18 09:00 bonelee 阅读(1413) 评论(1) 推荐(0)
摘要: RESCALING attribute data to values to scale the range in [0, 1] or [−1, 1] is useful for the optimization algorithms, such as gradient descent, that a 阅读全文
posted @ 2017-07-17 20:15 bonelee 阅读(3252) 评论(1) 推荐(0)
摘要: 可以直接绘图: https://www.kaggle.com/bonelee/a-journey-through-titanic/editnb 阅读全文
posted @ 2017-07-17 18:59 bonelee 阅读(305) 评论(0) 推荐(0)
摘要: 机器学习中的数据不平衡问题 机器学习中的数据不平衡问题 摘自:http://wap.sciencenet.cn/blogview.aspx?id=377102 最近碰到一个问题,其中的阳性数据比阴性数据少很多,这样的数据集在进行机器学习的时候会使得学习到的模型更偏向于预测结果为阴性。查找了相关的一些 阅读全文
posted @ 2017-07-14 14:29 bonelee 阅读(2111) 评论(1) 推荐(0)
摘要: 来自:https://www.zhihu.com/question/35649122 其实这里所说的数据量不足,可以换一种方式去理解:在维度高的情况下,数据相对少。举一个特例,比如只有一维,和1万个数据,那么这种情况下,我们可以认为数据量其实是足够的,因为数据密度相对来说很高。如果数据的维度有100 阅读全文
posted @ 2017-07-14 14:25 bonelee 阅读(3759) 评论(0) 推荐(0)
上一页 1 ··· 206 207 208 209 210 211 212 213 214 ··· 273 下一页