会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
More Sharing, More Happness. I`m Roly-Poly
我听见回声,来自山谷和心间,以寂寞的镰刀收割空旷的灵魂,不断地重复决绝,又重复幸福...
博客园
首页
新随笔
联系
管理
订阅
随笔分类 -
data mining
python - PipeMapRed.waitOutputThreads(): subprocess failed with code 1
摘要:hadoop上执行mapreduce streaming python程序报错, 报错详细信息为 python - PipeMapRed.waitOutputThreads(): subprocess failed with code 1 网上搜索后,得知该问题是由于 脚本程序本身问题。 解决办法,
阅读全文
posted @
2016-07-25 17:57
Roly-Poly
阅读(1882)
评论(0)
推荐(0)
【原创】各种聚类算法对比
摘要:像上一篇文章 《聚类思想分析》 所述, 聚类算法无所谓好坏,重点在于合理使用各类算法达到最优效果。-----------------------------------------------------------------------------------------------------...
阅读全文
posted @
2015-07-23 17:32
Roly-Poly
阅读(5768)
评论(0)
推荐(0)
【原创】Kmeans算法 优缺点分析
摘要:优点:原理简单(靠近中心点),实现容易(1、2 天),聚类效果中上(依赖K的选择)缺点:1. 无法确定K的个数 (根据什么指标确定K)2. 对离群点敏感 (容易导致中心点偏移)3. 算法复杂度不易控制 O(NKm), 迭代次数可能较多 (m可能会比较大)4. 局部最优解而不是全局优 (这个和初始点选...
阅读全文
posted @
2015-07-23 12:41
Roly-Poly
阅读(10136)
评论(0)
推荐(0)
【原创】聚类思想的分析
摘要:聚类算法在数据挖掘中经常使用,思想简单直接。 在系统中,自己也实现过几个聚类算法,做针对性的优化也并无它难度。 由于其方式的简单,开始也未对它有过深入思考。 但是,如果你想让数据自己说话,还是离不开聚类。 因此调研了很多聚类算法,做一些总结。-----------------------...
阅读全文
posted @
2015-07-23 12:35
Roly-Poly
阅读(2136)
评论(0)
推荐(0)
公告