亲

开始数据挖掘

scikit -liarn

特点：速度快，扩展性强，包含很多机器学习算法，数据集，工具，框架
包含numpy和scipy

亲和性分析实例

根据个体之间的相似度，确定亲疏关系
场景：商品推荐

numpy加载数据集

如果文件与代码不在同一文件夹，则要在前面加r

dataset_filename=r'E:\datemingning\PythonShizhan\Code_REWRITE\Chapter 1\affinity_dataset.txt'
x=np.loadtxt(dataset_filename)
打印前5个
x=np.loadtxt(dataset_filename)

排序找出最佳规则

支持度

指数据集中规则应验的次数

置信度

规则准确率如何

找出苹果个数

注意sample[3]提取第三列，print数字变量

num_apple_purchases=0
for sample in x:
if sample[3]==1:
num_apple_purchases+=1
print("**{0}**people bought Apples".format(num_apple_purchases))

posted @ 2018-12-27 16:59 一只鸡阅读(199) 评论(0) 收藏举报

刷新页面返回顶部

亲

开始数据挖掘

scikit -liarn

亲和性分析实例

numpy加载数据集

排序找出最佳规则

支持度

置信度

找出苹果个数

公告