08 2019 档案

k-means算法处理聚类标签不足的异常
摘要:k means算法在人群聚类场景中,是一个非常实用的工具。(该算法的原理可以参考 "K Means算法的Python实现" ) 常见调用方式 该算法常规的调用方式如下: 异常现象 常规情况下,以上处理后,会根据dataframe上的索引列顺序的 (0~8的数值)。 但是,我们在执行代码过程中,出现了 阅读全文

posted @ 2019-08-27 22:06 camash 阅读(1786) 评论(0) 推荐(0)

kettle处理未发现hadoop插件问题
摘要:背景:将测试环境的中kettle转换传输到生产环境上出现hadoop插件无法获取的错误 原因 : 迁到生产后,因为服务器带了主机名,所以在插件配置中使用主机名,而非ip地址。 处理方式 : 将里面的主机名改成ip地址即可。若遇到hadoop插件未发现的问题,可以考虑使用此法。 参考链接 : "1" 阅读全文

posted @ 2019-08-24 22:40 camash 阅读(2168) 评论(0) 推荐(0)

导航