共 9 页: 上一页 1 2 3 4 5 6 下一页 末页
摘要:初始化a = range(16)a = np.array(a)a = a.reshape(4,4)a[[ 0 1 2 3][ 4 5 6 7][ 8 9 10 11][12 13 14 15]]获取a的【0,1,4】行b = a[ range(2)+range(3,4),:][[ 0 1 2 3][... 阅读全文
posted @ 2014-10-21 15:43 joey周琦 阅读 (674) 评论 (0) 编辑
摘要:PCA understanding 我们希望获取玩具的位置,事实上我们只需要知道玩具在x轴的位置就可以了(但现实不知道)。我们利用三个坐标轴,获取了2*3维度的数据,现实中我们如何通过分析六维度数据来获取玩具的位置? 可以从上图看出camera A,B,C的x,y轴相关度都很明显,数据有冗余。 l 如何压缩数据?如何去除数据中的噪声,或者合并数据中相关的维度(来获取x轴数据) ... 阅读全文
posted @ 2014-09-23 11:15 joey周琦 阅读 (152) 评论 (0) 编辑
摘要:3.1冷启动问题简介: 冷启动问题(cold start)主要分三类: • 用户冷启动 • 物品冷启动 • 系统冷启动 参考解决方案: • 推热门 • 利用用户的信息。(如:性别、年龄、地域等) • 利用登录帐号的社交网络信息 • 要求新用户登录时做一些反馈 3.2利用用户注册信息 ... 阅读全文
posted @ 2014-09-18 19:18 joey周琦 阅读 (722) 评论 (0) 编辑
摘要:基本上可以通过3种方式联系用户兴趣和物品: 用户喜欢过的物品(item-cf) 用户的好友或者有相似兴趣的好友喜欢过的物品(user-cf) 用户具有哪些feature, 哪些物品保护 之前用了user-cf,item-cf, 现在考虑使用标签进行推荐。 标签是一种无层次化结构的、用来描述信息的关键词。 给物品打标签: 专家、作者 用户 标签... 阅读全文
posted @ 2014-09-18 11:38 joey周琦 阅读 (271) 评论 (0) 编辑
摘要:信息检索(informagto retrieval) 是从大规模非结构化数据(通常是文本)的集合中找出满足用户信息需求的资料 文档document 所有文档组成“文档集“(collection), 有时也称“语料库”(corpus) 查询(query) 相关的(relevant) 正确率(precision): 返回结果中 真正和信息需求相关的文档所占比例 //给出的结果,多少是真正需... 阅读全文
posted @ 2014-09-15 20:00 joey周琦 阅读 (202) 评论 (0) 编辑
摘要:2.1.1 文档分析及编码转换: 文档处理第一步,是将文件或web服务器上的一系列二进制字节序列转换为字符序列。 在实际中,首先要判断出文档的编码方式(机器学习分类、启发式等方法),确定文档的类型(word?zip?)然后将字节序列转换成字符序列。 2.1.2 文档单位(document unit)的选择: 常见的,将某个目录下的每个文件都看成一个文档。 ... 阅读全文
posted @ 2014-09-15 19:57 joey周琦 阅读 (853) 评论 (0) 编辑
摘要:转载于:http://blog.chinaunix.net/uid-20614631-id-1914849.html 亲测可用先把Cygwin下载下来,想在linux下编程的话一定要安装vim,gcc和gdb,现在主要是解决vim中backspace不能正常使用的问题。Cygwin安装之后打开显示的... 阅读全文
posted @ 2014-07-19 14:52 joey周琦 阅读 (266) 评论 (0) 编辑
摘要:LaTeX 处理三线表相当简单方便。用到的宏包主要是 booktabs 。代码如下:需要添加包:\usepackage{booktabs}。\documentclass{article}\usepackage{booktabs} \begin{document}\begin{table}[!t] \... 阅读全文
posted @ 2014-05-20 16:16 joey周琦 阅读 (3717) 评论 (0) 编辑
摘要:numpy.chararray.flattenchararray.flatten(order='C')Return a copy of the array collapsed into one dimension. Parameters :order : {‘C’, ‘F’, ‘A’}, opti... 阅读全文
posted @ 2014-05-18 17:03 joey周琦 阅读 (119) 评论 (0) 编辑
摘要:利用用户行为数据简介:用户在网站上最简单存在形式就是日志。原始日志(raw log)------>会话日志(session log)-->展示日志或点击日志用户行一般分为两种:1显性反馈:包括用户明确表示对物品喜好的行为(数据量小)2隐形反馈:网页浏览等(数据量大)用户行为的统一标准如下:协同滤波与... 阅读全文
posted @ 2014-04-16 16:29 joey周琦 阅读 (1848) 评论 (0) 编辑
共 9 页: 上一页 1 2 3 4 5 6 下一页 末页