摘要: 本篇文章将从贝叶斯公式出发,探究贝叶斯到底是啥,以及其在认知层面的巨大作用。不过据说每出现 1 个公式,文章阅读将下降 1/3。 华为大佬说:人工智能就是统计学。在我眼中,贝叶斯公式就是统计学走向机器学习的起点。 贝叶斯公式 贝叶斯定理(Bayes’s Rule):如果有k个相互独立事件 A1,A2 阅读全文
posted @ 2020-06-03 19:02 奈学教育 阅读(1144) 评论(0) 推荐(0)
摘要: Kafka 是一个高吞吐量的分布式的发布订阅消息系统,在全世界都很流行,在大数据项目里面使用尤其频繁。笔者看过多个大数据开源产品的源码,感觉 Kafka 的源码是其中质量比较上乘的一个,这得益于作者高超的编码水平和高超的架构设计能力。 Kafka 的核心源码分为两部分:客户端源码和服务端源码,客户端 阅读全文
posted @ 2020-06-03 17:04 奈学教育 阅读(335) 评论(0) 推荐(0)
摘要: 经常有大数据工程师问我,自己想往大数据架构师方向发展,问我应该怎么努力! 其实,蹲上架构师的坑需要的是更高层次的开发构架设计能力。这时候,架构师技术能力的强弱、素质的高低直接关乎了软件项目的成败!所以,架构师要对开发技术非常非常了解,脑海中要有一个体系! 多一点真诚,少一点套路!这里直接送给大家超全 阅读全文
posted @ 2020-06-03 15:29 奈学教育 阅读(449) 评论(0) 推荐(0)
摘要: 首先准备一个hadoop源码包,我选择的hadoop版本是:hadoop-2.7.7-src.tar.gz,在hadoop-2.7.7的源码包的根目录下有一个文档叫做BUILDING.txt,这其中说明了编译hadoop所需要的一些编译环境相关的东西。不同的hadoop版本的要求都不一样,对应的版本 阅读全文
posted @ 2020-06-03 12:17 奈学教育 阅读(266) 评论(0) 推荐(0)