摘要: Fuzzy C Means 算法及其 Python 实现 转自:http://note4code.com/2015/04/14/fuzzy-c-means-%E7%AE%97%E6%B3%95%E5%8F%8A%E5%85%B6-python-%E5%AE%9E%E7%8E%B0/ 1. 算法向 算 阅读全文
posted @ 2017-07-24 16:46 bonelee 阅读(4974) 评论(1) 推荐(0)
摘要: Bisecting k-means(二分K均值算法) 二分k均值(bisecting k-means)是一种层次聚类方法,算法的主要思想是:首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大程度降低聚类代价函数(也就是误差平方和)的簇划分为两个簇。以此进行下去,直到簇的数目等于用户给定的数目 阅读全文
posted @ 2017-07-24 16:06 bonelee 阅读(2658) 评论(0) 推荐(0)
摘要: 官方的demo 带归一化的例子: 参考:https://stackoverflow.com/questions/31447141/spark-mllib-kmeans-from-dataframe-and-back-again Create column from RDD It's very eas 阅读全文
posted @ 2017-07-24 15:20 bonelee 阅读(2927) 评论(0) 推荐(0)
摘要: 2017年7月4日,百度开源了一款主题模型项目,名曰:Familia。 InfoQ记者第一时间联系到百度Familia项目负责人姜迪并对他进行采访,在本文中,他将为我们解析Familia项目的技术细节。 什么是Familia Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业 阅读全文
posted @ 2017-07-24 11:13 bonelee 阅读(3003) 评论(0) 推荐(0)
摘要: 见:http://www.infoq.com/cn/news/2017/07/goole-sight-facets-ai https://github.com/PAIR-code/facets/blob/master/facets_dive/README.md Introduction The fa 阅读全文
posted @ 2017-07-24 10:57 bonelee 阅读(662) 评论(0) 推荐(0)
摘要: 摘自:http://www.infoq.com/cn/articles/user-portrait-collaborative-filtering-for-recommend-systems 我们会从一个真实的案例出发,虽然我们做了很多的推荐系统的案例,但毕竟不能把客户的数据给大家看,所以我们用了一 阅读全文
posted @ 2017-07-24 10:01 bonelee 阅读(1414) 评论(0) 推荐(0)