随笔分类 - 数据挖掘
该文被密码保护。
摘要:http://www.wtoutiao.com/p/10blYui.html
阅读全文
摘要:http://blog.csdn.net/conowen/article/details/7256260 这里有几种计算平台的Flynn分类法 GPU是SIMD 多核CPU是MIMD 硬件结果多核处理器是 SMP Symmetric Multi-Processor
阅读全文
摘要:第一篇,介绍TF-IDF的基本概念,和求法。注意,我的实现里面,把 Y部分都归一化了,提高计算。 http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 第二篇,介绍使用TF-IDF,来找出相似文章。使用了余弦相似性,其实就是两个向量的点乘/两个向量的模
阅读全文
摘要:这里有一些用户实时推荐框架,可以好好学习: http://www.cnblogs.com/kobedeshow/p/3569525.html
阅读全文
摘要:https://www.nowcoder.com/discuss/15168 个人感觉数据挖掘是一个比较大的概念,可以理解为: 数据挖掘 = 业务知识 + 自然语言处理技术( NLP ) + 计算机视觉技术( CV ) + 机器学习 / 深度学习( ML/DL ) ( 1 )其中业务知识具体指的是个
阅读全文
摘要:参考这篇文章: http://blog.csdn.net/rongyongfeikai2/article/details/40457827 这条关联规则的支持度:support = P(A并B) 这条关联规则的置信度:confidence = support(A并B)/suport(A) Aprio
阅读全文
摘要:http://mp.weixin.qq.com/s?__biz=MzAxMjcyNjE5MQ==&mid=2650486420&idx=1&sn=6c6884edabd123b9d2262cde900ba4df&scene=21#wechat_redirect
阅读全文
摘要:http://mt.sohu.com/20160906/n467836523.shtml
阅读全文
摘要:场景主要负责对用户意图的识别,对于场景的判断,需要结合用户的实时行为,来明确用户的意图是发散还是聚焦的,不同的场景采用不同的算法进行组装,比如在首页或者频道栏用户的目的性不是那么强,为了增加用户的粘性,可以基于标签分类的推荐、协同过滤、最新最热等的算法进行推荐。在用户浏览到某一应用的详情页,那么用户
阅读全文
摘要:总算找到视频了: http://list.youku.com/albumlist/show?id=18265477&ascending=1&page=1 其他笔记地址: http://www.cnblogs.com/charlesblc/p/5561536.html
阅读全文
摘要:http://study.163.com/course/courseMain.htm?courseId=321007
阅读全文

浙公网安备 33010602011771号