随笔分类 -  数据挖掘

摘要:参考文献: https://www.cnblogs.com/zhengxingpeng/p/6679280.html https://www.kdnuggets.com/2016/04/association-rules-apriori-algorithm-tutorial.html 代码: Apr 阅读全文
posted @ 2018-07-31 14:40 下划线是我 阅读(499) 评论(0) 推荐(0)
摘要:常见聚类算法比较:(One-class SVM versus Elliptic Envelope versus Isolation Forest versus LOF) http://scikit-learn.org/stable/modules/outlier_detection.html 为了实 阅读全文
posted @ 2018-07-31 14:24 下划线是我 阅读(944) 评论(0) 推荐(0)
摘要:2.1 协作型过滤 定义:对一大群人进行搜索,对这些人所偏爱的其他内容进行考察,并将他们组合起来构造出一个经过排名的推荐列表。 2.2 判断相似性 欧几里德距离 皮尔逊相关系数 定义:最佳拟合线(best-fit line)的相关系数(最小二乘法中的R) 计算公式 适用场景 非normalized 阅读全文
posted @ 2018-07-12 21:53 下划线是我 阅读(106) 评论(0) 推荐(0)