07 2018 档案

摘要:用隐藏分解发现隐藏的数据结构 我们现在有一个用户对看过的电影的评分表 我们看到,绿色用户对3个电影做了评价,蓝色用户对2个电影做了评价,红色用户对4个电影做了评价. 但无论多少个用户,相对大量的电影来说,每个用户只有可能看过很少的一部分电影. 如上图所示,黑点代表了用户u对电影v的评价,白点代表该用 阅读全文
posted @ 2018-07-25 17:27 Redheat 阅读(1017) 评论(0) 推荐(0)
摘要:近十年以来,推荐系统迅猛发展,比如说亚马逊的商品推荐等.而Netflix的比赛,让推荐系统更广为人知. 在YouTube,每分钟都会有上百个小时的视频汇聚,我们没法把视频一个个的看完,那么哪些视频是我们关心的?这是一个信息过载的例子. 信息量爆炸所带来的影响非常深远,衍生出了一种个性化思想,连接用户 阅读全文
posted @ 2018-07-24 19:23 Redheat 阅读(352) 评论(0) 推荐(0)
摘要:原生的ansible不支持service.status,在Google之后,发现有人提交了一个patch,可以支持status选项.见https://github.com/ritzk/ansible-modules-core/commit/ab4c9c226e94371c2b60aab57ef5b0 阅读全文
posted @ 2018-07-23 15:51 Redheat 阅读(2640) 评论(0) 推荐(0)
摘要:graphlab对中文的支持非常无解,怎么办? 代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week4 爬虫地址: https://githu 阅读全文
posted @ 2018-07-12 16:14 Redheat 阅读(406) 评论(0) 推荐(0)
摘要:案例: 现在手上有许多的文档,需要将其按照类型(体育,财经,科技等)进行分类,也就是对文章进行分组或聚类. 分析: 如果手上有已经标记过类型的数据,可以将其作为训练集进行学习. 那么这是否是一个多元分类问题? 其实是监督学习问题 现在我们有一堆无标签的文档,打算推断出相关文章的分组向量. Input 阅读全文
posted @ 2018-07-10 11:10 Redheat 阅读(2363) 评论(0) 推荐(0)
摘要:案例:在阅读文章时,推荐相似的文章. 这个案例简单粗暴,尤其是我看小说的时候,闹书荒的时候,真的很希望有这样的功能.(PS:我现在就职于某小说公司) 那么,如何衡量文章之间的相似度? 在开始讲之前,先提一下elasticsearch. elasticsearch所使用的索引方式被称为倒排索引.将文档 阅读全文
posted @ 2018-07-06 19:27 Redheat 阅读(739) 评论(0) 推荐(0)
摘要:代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week3 爬虫地址: https://github.com/RedheatWei/mtime_c 阅读全文
posted @ 2018-07-04 16:34 Redheat 阅读(213) 评论(0) 推荐(0)