随笔分类 -  大数据&算法

[转]深入HBase架构解析
摘要:HBase架构讲解非常清晰的一篇文章,转自 http://www.blogjava.net/DLevin/archive/2015/08/22/426877.htmlhttp://www.blogjava.net/DLevin/archive/2015/08/22/426950.htmlhttps: 阅读全文

posted @ 2017-05-17 11:47 gogoy 阅读(143) 评论(0) 推荐(0)

t分布及t分布表
摘要:http://baike.baidu.com/view/1419652.htm下表列出了自由度为1-30以及80、100、120等t-分布的单侧和双侧区间值。例如,当样本数量n=5时,则自由度v=4,我们就可以查找表中以4开头的行。该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。这... 阅读全文

posted @ 2015-05-29 17:08 gogoy 阅读(62529) 评论(0) 推荐(2)

PCA的数学原理
摘要:向量的表示及协方差矩阵 http://blog.csdn.net/songzitea/article/details/18219237 PCA的数学原理 http://blog.codinglabs.org/articles/pca-tutorial.html 总结: 1、要准确描述向量,首先要确定 阅读全文

posted @ 2015-05-27 11:06 gogoy 阅读(466) 评论(0) 推荐(0)

百度搜索引擎变现策略指标体系(转)
摘要:http://m.blog.csdn.net/blog/dustinsea/38384059下文就百度商业变现的指标体系进行概要描述,并针对一个类似于百度LBS系统的变现思路,阐述一个商业系统变现策略指标体系的建立过程。为什么需要商业变现策略指标体系一般情况下,一个互联网产品,或是一个移动端产品在发... 阅读全文

posted @ 2015-05-22 16:27 gogoy 阅读(719) 评论(0) 推荐(0)

箱形图/盒图(转)
摘要:http://zh.wikipedia.org/wiki/%E7%AE%B1%E5%BD%A2%E5%9C%96http://www.blogjava.net/norvid/articles/317235.html箱形图(英文:Box-plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示... 阅读全文

posted @ 2015-05-05 19:01 gogoy 阅读(922) 评论(0) 推荐(0)

四分位数(转)
摘要:http://zh.wikipedia.org/wiki/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。目录[隐藏]1概念2运算过程3例如4应用5... 阅读全文

posted @ 2015-05-05 17:47 gogoy 阅读(2003) 评论(0) 推荐(0)

概率论与数理统计复习
摘要:第0章 难点理解 详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解 https://blog.csdn.net/u011508640/article/details/72815981 极大似然估计:https://zhuanlan.zhihu.com/p/26614750 阅读全文

posted @ 2015-04-21 11:25 gogoy 阅读(2513) 评论(0) 推荐(0)

举个简单例子说明条件独立(转)
摘要:文章作者:程欣宇http://angeleyes.diandian.com/?p=244这个例子很好理解,A是熬夜,C是懒床,B是迟到。一般情况下,熬夜会增加懒床的概率,懒床会增加迟到的概率。当然,天气冷也会增加懒床的概率,堵车也会增加迟到的概率,现实生活中的可能性是很多的,我们现在只关注A熬夜和B... 阅读全文

posted @ 2014-12-13 19:25 gogoy 阅读(2304) 评论(0) 推荐(1)

多项分布概率公式的理解
摘要:http://crescentluna.github.io/2012/09/23/%E5%A4%9A%E9%A1%B9%E5%88%86%E5%B8%83%E6%A6%82%E7%8E%87%E5%85%AC%E5%BC%8F%E7%9A%84%E7%90%86%E8%A7%A3/#more-9ht... 阅读全文

posted @ 2014-12-13 18:48 gogoy 阅读(948) 评论(0) 推荐(0)

坐标旋转变换公式的推导(转)
摘要:翻译自: http://www.metro-hs.ac.jp/rs/sinohara/zahyou_rot/zahyou_rotate.htm翻译: 汤 永康出处: http://blog.csdn.net/tangyongkang转贴请注明出处1 围绕原点的旋转如下图, 在2维坐标上,有一点p(x... 阅读全文

posted @ 2014-12-11 14:04 gogoy 阅读(1277) 评论(0) 推荐(0)

学习Hadoop不错的系列文章(转)
摘要:http://www.cnblogs.com/xia520pi/archive/2012/04/22/2464934.html1)Hadoop学习总结 (1)HDFS简介 地址:http://forfuture1978.iteye.com/blog/615033 (2)HDFS读写过程解析 地址:http://blog.csdn.net/forfuture1978/article/details/6001302 (3)Map-Reduce入门 地址:http://blog.csdn.net/forfuture1978/article/details/6043926 (4)Map-... 阅读全文

posted @ 2014-03-18 09:20 gogoy 阅读(182) 评论(0) 推荐(0)

大数据人才缺乏,你准备好了吗?
摘要:尽管还存在安全等问题,但Hadoop已经为部署在大企业中的大型项目做好准备。Hadoop作为Apache的顶级开源项目,主要被应用于分析大数据集,现今已被包括eBay、Facebook、Yahoo、AOL和Twitter等互联网公司广泛采用。而就在上个月微软、IBM和甲骨文也都纷纷拥抱Hadoop。http://www.csdn.net/article/2011-11-24/308082http://wikipedia.h.baike.com/article-108632.html越来越多的企业已经开始摸索Hadoop技术,目的就是为处理博客、点击所带来的数据流和社交媒体所带来的数据。Hado 阅读全文

posted @ 2014-01-28 10:33 gogoy 阅读(417) 评论(0) 推荐(0)

为大数据时代做好准备——来自《大数据的冲击》一书精彩片段(转)
摘要:需求高涨的数据科学家从技术方面来看,硬盘价格下降,NoSQL数据库等技术的出现,使得和过去相比,大量数据能够以廉价高效的方式进行存储。此外,像Hadoop这样能够在通用性服务器上工作的分布式处理技术的出现,也使得对庞大的非结构化数据进行统计处理的工作比以往更快速且更廉价。然而,就算所拥有的工具再完美,它本身是不可能让数据产生价值的。接下来我们还需要能够运用这些工具的人才,他们能够从堆积如山的大量数据中找到金矿,并将数据的价值以易懂的形式传达给决策者,最终得以在业务上实现。具备这些技能的人才,就是在大数据浪潮如火如荼的美国目前正千金难求的“数据科学家”。对数据科学家的关注,源于大家逐步认识到,G 阅读全文

posted @ 2013-12-29 13:09 gogoy 阅读(529) 评论(0) 推荐(0)

导航