开始数据挖掘

scikit -liarn

特点:速度快,扩展性强,包含很多机器学习算法,数据集,工具,框架
包含numpy和scipy

亲和性分析实例

根据个体之间的相似度,确定亲疏关系
场景:商品推荐

numpy加载数据集

如果文件与代码不在同一文件夹,则要在前面加r

dataset_filename=r'E:\datemingning\PythonShizhan\Code_REWRITE\Chapter 1\affinity_dataset.txt'
x=np.loadtxt(dataset_filename)
打印前5个
x=np.loadtxt(dataset_filename)

排序找出最佳规则

支持度

指数据集中规则应验的次数

置信度

规则准确率如何

找出苹果个数

注意sample[3]提取第三列,print数字变量

num_apple_purchases=0
for sample in x:
if sample[3]==1:
num_apple_purchases+=1
print("**{0}**people bought Apples".format(num_apple_purchases))

posted @ 2018-12-27 16:59  一只鸡  阅读(198)  评论(0)    收藏  举报