亲
开始数据挖掘
scikit -liarn
特点:速度快,扩展性强,包含很多机器学习算法,数据集,工具,框架
包含numpy和scipy
亲和性分析实例
根据个体之间的相似度,确定亲疏关系
场景:商品推荐
numpy加载数据集
如果文件与代码不在同一文件夹,则要在前面加r
dataset_filename=r'E:\datemingning\PythonShizhan\Code_REWRITE\Chapter 1\affinity_dataset.txt'
x=np.loadtxt(dataset_filename)
打印前5个
x=np.loadtxt(dataset_filename)
排序找出最佳规则
支持度
指数据集中规则应验的次数
置信度
规则准确率如何
找出苹果个数
注意sample[3]提取第三列,print数字变量
num_apple_purchases=0
for sample in x:
if sample[3]==1:
num_apple_purchases+=1
print("**{0}**people bought Apples".format(num_apple_purchases))
浙公网安备 33010602011771号