iBit

导航

随笔分类 -  python数据挖掘入门与实践(自学)

4、亲和性分析(关联分析)——推荐电影
摘要:1、主要概念: 找出两个对象共同出现的情况 数据通常为交易信息的数据——从中能看出哪些商品是一起购买的 之前的亲和性分析示例比较简单,适用于商品数量少的情况。但如果规则生成方法像那样简单,计算这些规则所需要的时间将呈指数增长(n个特征规则就有2^n-1:如3项集有7规则——2是因为分为前提和结论(有 阅读全文

posted @ 2019-10-10 11:32 iBit 阅读(802) 评论(1) 推荐(0)

2、分类问题示例
摘要:基本概念: 只关注类别这个变量,把一条条数据划分为不同的类 目标:根据已知类别的数据集,经过训练得到一个分类模型,再用模型对类别未知的数据进行分类。 过程思路: 1、准备数据集 Iris植物分类数据集(scikit-learn库里内置的该数据集,可直接导入) 四个特征:sepal length、se 阅读全文

posted @ 2019-10-08 21:38 iBit 阅读(563) 评论(0) 推荐(0)

1、亲和性分析示例
摘要:基本概念: 根据样本个体之间的相似度 支持度support 置信度confident 示例:如果一个人买了商品X,那么他很有可能购买商品Y (本例有两个特征值0和1,表示是否购买) 过程思路: 1、在numpy中加载数据集 numpy是二维数组,看上去像一张表。 数组的每一项为个体的某项特征值。 数 阅读全文

posted @ 2019-10-08 21:10 iBit 阅读(541) 评论(1) 推荐(0)