2018 年 7月随笔档案 - Redheat

机器学习基础8--矩阵分解

摘要：用隐藏分解发现隐藏的数据结构我们现在有一个用户对看过的电影的评分表我们看到,绿色用户对3个电影做了评价,蓝色用户对2个电影做了评价,红色用户对4个电影做了评价. 但无论多少个用户,相对大量的电影来说,每个用户只有可能看过很少的一部分电影. 如上图所示,黑点代表了用户u对电影v的评价,白点代表该用阅读全文

posted @ 2018-07-25 17:27 Redheat 阅读(1017) 评论(0) 推荐(0)

机器学习基础7--推荐系统

摘要：近十年以来,推荐系统迅猛发展,比如说亚马逊的商品推荐等.而Netflix的比赛,让推荐系统更广为人知. 在YouTube,每分钟都会有上百个小时的视频汇聚,我们没法把视频一个个的看完,那么哪些视频是我们关心的?这是一个信息过载的例子. 信息量爆炸所带来的影响非常深远,衍生出了一种个性化思想,连接用户阅读全文

posted @ 2018-07-24 19:23 Redheat 阅读(352) 评论(0) 推荐(0)

对ansible不支持service模块的status命令进行修正

摘要：原生的ansible不支持service.status,在Google之后,发现有人提交了一个patch,可以支持status选项.见https://github.com/ritzk/ansible-modules-core/commit/ab4c9c226e94371c2b60aab57ef5b0 阅读全文

posted @ 2018-07-23 15:51 Redheat 阅读(2640) 评论(0) 推荐(0)

机器学习实战3--豆瓣读书简介

摘要：graphlab对中文的支持非常无解,怎么办? 代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week4 爬虫地址: https://githu 阅读全文

posted @ 2018-07-12 16:14 Redheat 阅读(406) 评论(0) 推荐(0)

机器学习基础6--集群模型和算法

摘要：案例: 现在手上有许多的文档,需要将其按照类型(体育,财经,科技等)进行分类,也就是对文章进行分组或聚类. 分析: 如果手上有已经标记过类型的数据,可以将其作为训练集进行学习. 那么这是否是一个多元分类问题? 其实是监督学习问题现在我们有一堆无标签的文档,打算推断出相关文章的分组向量. Input 阅读全文

posted @ 2018-07-10 11:10 Redheat 阅读(2363) 评论(0) 推荐(0)

机器学习基础5--文档相似性检索与度量算法

摘要：案例:在阅读文章时,推荐相似的文章. 这个案例简单粗暴,尤其是我看小说的时候,闹书荒的时候,真的很希望有这样的功能.(PS:我现在就职于某小说公司) 那么,如何衡量文章之间的相似度? 在开始讲之前,先提一下elasticsearch. elasticsearch所使用的索引方式被称为倒排索引.将文档阅读全文

posted @ 2018-07-06 19:27 Redheat 阅读(739) 评论(0) 推荐(0)

机器学习实战2--时光网评论分析

摘要：代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week3 爬虫地址: https://github.com/RedheatWei/mtime_c 阅读全文

posted @ 2018-07-04 16:34 Redheat 阅读(213) 评论(0) 推荐(0)

Redheat

一个误把红帽拼错的学渣

07 2018 档案

公告