上一页 1 2 3 4 5 6 7 8 9 ··· 20 下一页
摘要: 现在假设你有100万个用户,每次对一个用户进行一次推荐时,需要计算100万次距离。如果每一秒需要进行多次推荐的话计算次数会十分巨大,系统会很慢。正式的说话是,基于令居的推荐系统的主要缺点是延迟性太差。 1 )基于用户的过滤的两个主要问题: 1.扩展性问题: 随着用户数量的增大,计算量会增大,基于用户 阅读全文
posted @ 2016-10-23 17:51 曹孟德 阅读(695) 评论(0) 推荐(0)
摘要: 显式评级:显式评级是指用户显式的给出物品的评价结果,例如直接打分 显式评级存在的问题: 1 用户大多具有懒惰性,不愿意对物品进行评级:例如大部分人对购买的物品不愿意给出评价,这体现了一种用户懒惰行为 2 用户可能撒谎或者只给出部分信息:如果某人克服了懒惰性,真的对物品进行评分,该用户也可能撒谎 3 阅读全文
posted @ 2016-10-23 15:43 曹孟德 阅读(876) 评论(0) 推荐(0)
摘要: 1) 输入help(sorted)可以得到下面类容: sorted(...) sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list sorted 可以对任意一个可迭代序列进行排序。如下: sorted对对迭代序 阅读全文
posted @ 2016-10-20 10:13 曹孟德 阅读(347) 评论(0) 推荐(0)
摘要: 协同过滤,之所以协同是因为该方法是基于其他用户进行推荐的。工作流程如下:假设我们的任务是向你推荐一本书。我们会在网络上搜索与你相似兴趣的用户。一旦找到了这个用户,就看看这个用户喜欢的书,然后将其推荐给你。 如何寻找相似用户?一般而言,通过计算两个用户的距离,两个用户距离越小则相似度越高。先来看距离的 阅读全文
posted @ 2016-10-19 22:00 曹孟德 阅读(307) 评论(0) 推荐(0)
摘要: 标准Python中一般使用列表保存值,可以当做数组来使用,但是由于列表的元素可以是任何对象,因此列表中保存的是数组的指针。这样为了保存一组简单的数据而需要大量的指针和对象。对于数值运算来说,这种结构显然浪费啦内存和CPU计算时间。 NumPy的出现弥补啦这些不足。NumPy提供了两种基本对象: 1 阅读全文
posted @ 2016-10-18 21:06 曹孟德 阅读(678) 评论(0) 推荐(0)
摘要: re模块包含对正则表达式的支持.正则表达式是可以匹配文本片段的模式,最简单的正则表达式就是普通的字符串,可以匹配其自身。 一 正则表达式中的元字符介绍: . 称为通配符,可以匹配任何字符(除了换行符) ^ 脱字符,匹配字符串的开头 $ 匹配字符串的结尾 * 匹配前面出现的正则表达式符号0次到多次 + 阅读全文
posted @ 2016-10-18 11:55 曹孟德 阅读(374) 评论(0) 推荐(0)
摘要: 向量和数组的优势是可以随机的存取元素和在末尾添加删除元素,而当插入元素时,需要移动大量的数据,消耗大量的时间。而链表的优势是可以在O(1)删除和插入数据。所以在频繁移动元素时,可以使用链表。 分析:如果用一个数组来保存,题目中的文本随着光标位置的移动需不断的插入字符,这样会导致大量字符移动问题。解决 阅读全文
posted @ 2016-09-28 11:58 曹孟德 阅读(1240) 评论(0) 推荐(0)
摘要: 题意:给定fibonacci数列,输入前缀,求出下标。题目中fibonacci数量达到100000,而题目输入的前缀顶多为40位数字,这说明我们只需要精确计算fibinacci数前40位即可。查询时使用字典树。在计算时,为了保证前40位精确无误。在此我计算了前60位。以保证前面不在进位。 注意点: 阅读全文
posted @ 2016-09-26 10:46 曹孟德 阅读(192) 评论(0) 推荐(0)
摘要: 离散化处理。判断建筑可见性比较麻烦。下面采用离散化解决:把所有的x坐标排序去重,在相邻两个x坐标表示的区间中,整个区间要么同时可见,要么同时不可见。如何判断该区间是否可见?具体做法是选取该区间中点坐标x=mx来做代表,判断mx是否可见。那么判断该监周屋是否在点mx0可见?首先该建筑物必须包含该点,并 阅读全文
posted @ 2016-09-24 11:15 曹孟德 阅读(330) 评论(0) 推荐(0)
摘要: //--------------------------------------------------------------- /*---字典树应用问题。考虑到要查询的次数在10^6,显然直接插入后dfs来查找必然超时间。好在每一个单词长度 ---不超过20,这样可以枚举每个单词子串,然后插入即可。例如abc子串为a,b,c,ab,bc,abc。但是要注意的是同一个 ---串可能有相同的子串... 阅读全文
posted @ 2016-09-19 15:30 曹孟德 阅读(247) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 20 下一页