随笔分类 - 数据挖掘
摘要:还是把这本书的读书笔记,单独拎出来吧,因为内容比较多。 P38. Logistic 回归。 觉得还蛮实用的。囫囵吞枣看的。要细看。
阅读全文
摘要:因为逻辑回归对于计算广告学非常重要。也是我们平时广告推荐、CTR预估最常用到的算法。所以单独开一篇文章讨论。 参考这篇文章:http://www.cnblogs.com/sparkwen/p/3441197.html 逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,逻
阅读全文
摘要:https://www.zhihu.com/question/41176911/answer/90066752 这里面有关于Deep Learning和蒙特卡洛树的一些内容 https://www.zhihu.com/question/22298352/answer/34267457 这里面有关于卷
阅读全文
摘要:在这篇文章 http://www.cnblogs.com/charlesblc/p/6193867.html 讲SVM的过程中,提到了KNN算法。有点熟悉,上网一查,居然就是K近邻算法,机器学习的入门算法。 参考内容如下:http://www.cnblogs.com/charlesblc/p/619
阅读全文
摘要:因为SVM和统计机器学习内容很多,所以从 http://www.cnblogs.com/charlesblc/p/6188562.html 这篇文章里面分出来,单独写。 为什么说SVM和统计学关系很大。 看统计学的定义:统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测
阅读全文
摘要:参考 http://www.cnblogs.com/shishanyuan/p/4721326.html 1、 Spark运行架构 1.1 术语定义 1.2 Spark运行基本流程 Spark运行基本流程参见下面示意图 1. 构建Spark Application的运行环境(启动SparkConte
阅读全文
摘要:因为协同过滤内容比较多,就新开一篇文章啦~~ 聚类和线性回归的实战,可以看:http://www.cnblogs.com/charlesblc/p/6159187.html 协同过滤实战,仍然参考:http://www.cnblogs.com/shishanyuan/p/4747778.html 其
阅读全文
摘要:上一篇文章提到了数据挖掘、机器学习、深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:https://zhuanlan.zhihu.com/p/20582907?refer=wangchu
阅读全文
摘要:今天看到这篇文章里面提到如何选择模型,觉得非常好,单独写在这里。 更多的机器学习实战可以看这篇文章:http://www.cnblogs.com/charlesblc/p/6159187.html 另外关于机器学习与数据挖掘的区别, 参考这篇文章:https://www.zhihu.com/ques
阅读全文
摘要:理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html 这里是实战部分。参考了 http://www.cnblogs.com/shishanyuan/p/4747778.html 采用了三个案例,分别对应聚类、回归和协同过滤的算法。
阅读全文
摘要:来吧骚年,看看海量数据处理方面的面试题吧。 原文:(Link, 其实引自这里 Link, 而这个又是 Link 的总结) 另外还有一个系列,挺好的:http://blog.csdn.net/v_july_v/article/category/1106578 另: Given 1 billion nu
阅读全文
摘要:今天有猎头找我要推荐高频交易的工作。本小白不懂这些高深的东西,所以找了些东西来科普。 只记录些觉得最有意思的笔记。 https://www.zhihu.com/question/19839828/answer/28434795 按照现在市面上的主流认知,我想大多数人概念里的高频交易系统是这样的: 交
阅读全文
摘要:找了这篇文章看了一下面试题<Spark 和hadoop的一些面试题(准备)> http://blog.csdn.net/qiezikuaichuan/article/details/51578743 其中有一道题目很不错,详见: http://www.aboutyun.com/thread-1882
阅读全文
摘要:之前已经有一篇文章是讲了函数式编程 http://www.cnblogs.com/charlesblc/p/6110484.html 今天又翻到了ruanyifeng的文章 http://www.ruanyifeng.com/blog/2012/04/functional_programming.h
阅读全文
摘要:参考这篇文章: http://www.ibm.com/developerworks/cn/java/j-lo-funinscala1/ 这也是一个系列 严格意义上的编程范式分为:命令式编程(Imperative Programming)、函数式编程(Functional Programming)和逻
阅读全文
摘要:然后看的是机器学习这一块,因为偏理论,可以先看完。其他的实践,再看。 http://www.cnblogs.com/shishanyuan/p/4747761.html “机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。” 一种经常引用的英文定义是:A computer program
阅读全文
摘要:今天用了一下公司的hadoop客户端,从外面下载的客户端不能用,只能用这个wiki里面提供的:link 装在了 tc-cm-201511novam12x12n0.tc 目录 /home/work/vip/hadoop-client/hadoop/bin 命令 然后再把这个文件删掉吧: 支持的命令包括
阅读全文
该文被密码保护。
摘要:要学习分布式以及数据分析、机器学习之类的,觉得可以通过一些实际的编码项目入手。最近Spark很火,也有不少招聘需要Spark,而且与传统的Hadoop相比,Spark貌似有一些优势。所以就以Spark来学习下。 安装部署等可以参考之前的文章:http://www.cnblogs.com/charle
阅读全文

浙公网安备 33010602011771号