yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理
上一页 1 ··· 188 189 190 191 192 193 194 195 196 ··· 367 下一页

2016年4月12日 #

摘要: HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于B 阅读全文
posted @ 2016-04-12 02:36 xxxxxxxx1x2xxxxxxx 阅读(412) 评论(0) 推荐(0)

摘要: 这门课程是针对大数据工程师和云计算工程师的基础课程,同时也是所有计算机专业人士必须掌握的一门课程。 如果不掌握数据结构和算法,你将难以掌握高效、专业的数据处理手段,更难以从容应对复杂的大数据处理场景。 请思考以下问题: 1、社交网站(如微博、facebook)中,人与人的关系是海量数据,你如何研究和 阅读全文
posted @ 2016-04-12 02:35 xxxxxxxx1x2xxxxxxx 阅读(332) 评论(0) 推荐(0)

摘要: 1.课程环境 本课程涉及的技术产品及相关版本: 技术 版本 Linux CentOS 6.5 Java 1.7 Hadoop2.0 2.6.0 Hadoop1.0 1.2.1 Zookeeper 3.4.6 CDH Hadoop 5.3.0 Vmware 10 Hive 0.13.1 HBase 0 阅读全文
posted @ 2016-04-12 02:31 xxxxxxxx1x2xxxxxxx 阅读(1073) 评论(0) 推荐(0)

摘要: SPSS Modeler是业界极为著名的数据挖掘软件,其前身为SPSS Clementine。SPSS Modeler内置丰富的数据挖掘模型,以其强大的挖掘功能和友好的操作习惯,深受用户的喜爱和好评,成为众多知名企业在数据挖掘项目上的软件产品选择。 本课程以SPSS Modeler为应用软件,以数据 阅读全文
posted @ 2016-04-12 02:27 xxxxxxxx1x2xxxxxxx 阅读(3920) 评论(0) 推荐(0)

摘要: 本课程主要讲解目前大数据领域最热门、最火爆、最有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、 阅读全文
posted @ 2016-04-12 02:25 xxxxxxxx1x2xxxxxxx 阅读(1709) 评论(0) 推荐(0)

摘要: 2013年,云计算领域从此多了一个名词“Docker”。以轻量著称,更好的去解决应用打包和部署。之前我们一直在构建Iaas,但通过Iaas去实现统一功 能还是相当复杂得,并且维护复杂。将特殊性封装到镜像中实现几乎一致得部署方法,它就是“Docker”,以容器为技术核心,实现了应用的标准化。企业可 以 阅读全文
posted @ 2016-04-12 02:22 xxxxxxxx1x2xxxxxxx 阅读(659) 评论(0) 推荐(0)

摘要: 随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑。于是善于学习的程序员们开始了R语言的学习 之旅。对于有其他语言背景的程序员来说,学习R的语 阅读全文
posted @ 2016-04-12 02:20 xxxxxxxx1x2xxxxxxx 阅读(606) 评论(0) 推荐(0)

摘要: 鉴于目前大数据Hadoop 2.x被企业广泛使用,在实际的企业项目中需要更加深入的灵活运用,并且Hadoop 2.x是大数据平台处理 的框架的基石,尤其在海量数据的存储HDFS、分布式资源管理和任务调度YARN及分布式计算框架MapReduce。然而当前众多书籍和 视频教程资料中,没有一套完整的、深 阅读全文
posted @ 2016-04-12 02:16 xxxxxxxx1x2xxxxxxx 阅读(273) 评论(0) 推荐(0)

2016年4月11日 #

摘要: 什么是MapReduce? MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。他极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运 阅读全文
posted @ 2016-04-11 22:47 xxxxxxxx1x2xxxxxxx 阅读(337) 评论(0) 推荐(0)

摘要: 1.1、课程的背景 Storm是什么? 为什么学习Storm? Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等, 大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Sto... 阅读全文
posted @ 2016-04-11 22:46 xxxxxxxx1x2xxxxxxx 阅读(332) 评论(0) 推荐(0)

上一页 1 ··· 188 189 190 191 192 193 194 195 196 ··· 367 下一页