随笔分类 -  AI

摘要:用隐藏分解发现隐藏的数据结构 我们现在有一个用户对看过的电影的评分表 我们看到,绿色用户对3个电影做了评价,蓝色用户对2个电影做了评价,红色用户对4个电影做了评价. 但无论多少个用户,相对大量的电影来说,每个用户只有可能看过很少的一部分电影. 如上图所示,黑点代表了用户u对电影v的评价,白点代表该用 阅读全文
posted @ 2018-07-25 17:27 Redheat 阅读(1013) 评论(0) 推荐(0)
摘要:近十年以来,推荐系统迅猛发展,比如说亚马逊的商品推荐等.而Netflix的比赛,让推荐系统更广为人知. 在YouTube,每分钟都会有上百个小时的视频汇聚,我们没法把视频一个个的看完,那么哪些视频是我们关心的?这是一个信息过载的例子. 信息量爆炸所带来的影响非常深远,衍生出了一种个性化思想,连接用户 阅读全文
posted @ 2018-07-24 19:23 Redheat 阅读(348) 评论(0) 推荐(0)
摘要:graphlab对中文的支持非常无解,怎么办? 代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week4 爬虫地址: https://githu 阅读全文
posted @ 2018-07-12 16:14 Redheat 阅读(401) 评论(0) 推荐(0)
摘要:案例: 现在手上有许多的文档,需要将其按照类型(体育,财经,科技等)进行分类,也就是对文章进行分组或聚类. 分析: 如果手上有已经标记过类型的数据,可以将其作为训练集进行学习. 那么这是否是一个多元分类问题? 其实是监督学习问题 现在我们有一堆无标签的文档,打算推断出相关文章的分组向量. Input 阅读全文
posted @ 2018-07-10 11:10 Redheat 阅读(2351) 评论(0) 推荐(0)
摘要:案例:在阅读文章时,推荐相似的文章. 这个案例简单粗暴,尤其是我看小说的时候,闹书荒的时候,真的很希望有这样的功能.(PS:我现在就职于某小说公司) 那么,如何衡量文章之间的相似度? 在开始讲之前,先提一下elasticsearch. elasticsearch所使用的索引方式被称为倒排索引.将文档 阅读全文
posted @ 2018-07-06 19:27 Redheat 阅读(730) 评论(0) 推荐(0)
摘要:代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week3 爬虫地址: https://github.com/RedheatWei/mtime_c 阅读全文
posted @ 2018-07-04 16:34 Redheat 阅读(207) 评论(0) 推荐(0)
摘要:如线性回归一样,我们也分成了训练集和测试集. 用训练集进行分类器的学习,用测试集来评估分类错误. 分类错误: 测试集 -> 隐藏类型标签 -> 放到分类器进行处理 -> 得出结果 -> 与定义好的类型标签进行比较 错误率: 分类错误数/总句子数 正确率: 分类正确数/总句子数 那么,什么样的正确率才 阅读全文
posted @ 2018-06-20 19:14 Redheat 阅读(299) 评论(0) 推荐(0)
摘要:案例: 餐厅推荐系统 目标: 输入一个食物名称,找到最佳的餐厅 我们可以通过评论,了解一个餐厅的食物如何. 比如说我们需要寻找寿司(sushi): 1.Watching the chefs create incredible edible art made the experience very u 阅读全文
posted @ 2018-06-20 17:22 Redheat 阅读(490) 评论(0) 推荐(0)
摘要:代码地址(附作业答案): https://github.com/RedheatWei/aiproject/tree/master/Machine%20Learning%20Specialization/week2 阅读全文
posted @ 2018-06-19 18:20 Redheat 阅读(909) 评论(0) 推荐(0)
摘要:再次回到上一节的13次模型. 这个疯狂的曲线造成了一种现象过拟合. 很明显,你的房子不可能只值这么点价钱,所以看上去,这个13次模型甚至还不如一开始的二次模型. 那么现在有个疑问,我们应该怎样去选择最合适的模型? 我们想要准确预测,但是我们无法观测未来. 下面我们模拟一次预测过程: 1.我们随机将一 阅读全文
posted @ 2018-06-13 18:27 Redheat 阅读(310) 评论(0) 推荐(1)
摘要:定义: 线性回归(Linear Regression)是利用线性回归方程的最小平方函数,对一个或多个自变量和因变量之间关系进行建模的一种回归分析。 案例: 房价预测 目标: 房屋大小(X)和价格(Y)之间的关系 如图所示,我们将房屋价格Y,与房屋大小X,绘制在坐标系. 在这里会引入新的定义: X:特 阅读全文
posted @ 2018-06-08 09:42 Redheat 阅读(439) 评论(0) 推荐(0)