rabby

2010年9月19日

集体智慧编程-making recommendations

摘要: 1 通过Euclidean distance 和 Pearson correlation.寻找用户得“相似度”,Euclidean比较好理解,和曼哈顿差不多,而Pearson 就比较高深了,是按照两组数据所产生得“直线”(correlation)来比较相似度,直线的度数(45度为绝对相似)。2根据相似度,某物所产生的推荐值也不同(设x是寻找者,y被询... 阅读全文

posted @ 2010-09-19 02:31 rabby 阅读(201) 评论(0) 推荐(0)

2010年7月18日

python 爬虫 ,抓取所有豆瓣好友读的书,列出读过最多的书。(模拟loging豆瓣)

摘要: 先模拟loging豆瓣,保存cookie,然后用根据豆瓣网页特性,读取好友列表,从每个好友里的收藏里,读取所读书籍的名字,把书名储存在字典中避免重复。输出按value排序字典。 阅读全文

posted @ 2010-07-18 18:44 rabby 阅读(1605) 评论(2) 推荐(1)

导航