yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理

2016年4月11日 #

摘要: 什么是MapReduce? MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。他极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运 阅读全文
posted @ 2016-04-11 22:47 xxxxxxxx1x2xxxxxxx 阅读(337) 评论(0) 推荐(0)

摘要: 1.1、课程的背景 Storm是什么? 为什么学习Storm? Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等, 大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Sto... 阅读全文
posted @ 2016-04-11 22:46 xxxxxxxx1x2xxxxxxx 阅读(332) 评论(0) 推荐(0)

摘要: Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并 阅读全文
posted @ 2016-04-11 22:44 xxxxxxxx1x2xxxxxxx 阅读(549) 评论(0) 推荐(0)

摘要: 随着云计算、大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈。谷歌、淘宝、百度、京东等底层都应用hadoop。越来越多的企 业急需引入hadoop技术人才。由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员。 Ha 阅读全文
posted @ 2016-04-11 22:43 xxxxxxxx1x2xxxxxxx 阅读(281) 评论(0) 推荐(0)

摘要: Hadoop的前景 随着云计算、大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈。谷歌、淘宝、百度、京东等底层都应用hadoop。越来越多的企 业急需引入hadoop技术人才。由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Andr 阅读全文
posted @ 2016-04-11 22:41 xxxxxxxx1x2xxxxxxx 阅读(275) 评论(0) 推荐(0)

摘要: 阅读全文
posted @ 2016-04-11 22:40 xxxxxxxx1x2xxxxxxx 阅读(207) 评论(0) 推荐(0)

摘要: Spark内核源码剖析、Hadoop高端 阅读全文
posted @ 2016-04-11 22:38 xxxxxxxx1x2xxxxxxx 阅读(223) 评论(0) 推荐(0)

摘要: 本项目主要讲解了一套应用于互联网电商企业中,使用Java、Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为、页面跳转行为、购物行为、广告点击行为等)进行复杂的分析。用统计分析出来的数据,辅助公司中的PM(产品经理)、数据分析师以及管理人员分析现有产品的情况,并根据用户行为 阅读全文
posted @ 2016-04-11 22:37 xxxxxxxx1x2xxxxxxx 阅读(2811) 评论(2) 推荐(0)

摘要: 离线数据分析平台是一种利用hadoop集群开发工具的一种方式,主要作用是帮助公司对网站的应用有一个比较好的了解。尤其是在电商、旅游、银行、证券、游戏等领域有非常广泛,因为这些领域对数据和用户的特性把握要求比较高,所以对于离线数据的分析就有比较高的要求了。 讲师本人之前在游戏、旅游等公司专门从事离线数 阅读全文
posted @ 2016-04-11 22:31 xxxxxxxx1x2xxxxxxx 阅读(1780) 评论(0) 推荐(0)

摘要: Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。 讲师本人之前在互联网大数据、国家水电数据中心方面的项 阅读全文
posted @ 2016-04-11 22:27 xxxxxxxx1x2xxxxxxx 阅读(301) 评论(0) 推荐(0)

摘要: 近年来,金融领域的量化分析越来越受到理论界与实务界的重视,量化分析的技术也取得了较大的进展,成为备受关注的一个热点领域。所谓金融量化,就是将金融分析理论与计算机编程技术相结合,更为有效的利用现代计算技术实现准确的金融资产定价以及交易机会的发现。量化分析目前已经涉及到金融领域的方方面面,包括基础和衍生 阅读全文
posted @ 2016-04-11 22:16 xxxxxxxx1x2xxxxxxx 阅读(4673) 评论(0) 推荐(1)

摘要: 注:在上一篇的一般线性回归中,使用的假设函数是一元一次方程,也就是二维平面上的一条直线。但是很多时候可能会遇到直线方程无法很好的拟合数据的情况,这个时候可以尝试使用多项式回归。多项式回归中,加入了特征的更高次方(例如平方项或立方项),也相当于增加了模型的自由度,用来捕获数据中非线性的变化。添加高阶项 阅读全文
posted @ 2016-04-11 22:13 xxxxxxxx1x2xxxxxxx 阅读(446) 评论(0) 推荐(0)

摘要: elasticsearch集群的安装搭建、创建索引的流程、集群中查询的流程、 es java客户端jest使用. 阅读全文
posted @ 2016-04-11 22:10 xxxxxxxx1x2xxxxxxx 阅读(205) 评论(0) 推荐(0)

摘要: 吴超老师 超人学院CEO 多年从事Hadoop大数据开发及教学工作,擅长Hadoop大数据开发、优化、存储等,培养近千名的大数据开发学员,超过1000小时的培训经验,在企业及学员中得到一致的好评,现在致力于培养大数据高端人才,让学员可以高薪就业,让企业找到满意的人才。 徐老师 大数据高级工程师 曾就 阅读全文
posted @ 2016-04-11 21:59 xxxxxxxx1x2xxxxxxx 阅读(192) 评论(0) 推荐(0)

摘要: Java IO/NIO JVM原理与配置、调优 Socket 网络套接字技术 Java Collection java Reflection 多线程与并发编程 设计模式 Collection深入 流式计算原理及应用场景 Storm Kafka Redis 实战案例 离线计算原理及应用场景 Hadoo 阅读全文
posted @ 2016-04-11 21:54 xxxxxxxx1x2xxxxxxx 阅读(259) 评论(0) 推荐(0)

摘要: “大数据分析高级工程师”培训 随着云时代的来临,大数据技术将具有越来越重要的战略意义。大数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产要素,人们对于海量数据的运用将预示着新一轮生产率增长和消费者盈余浪潮的到来。大数据分析技术将帮助企业用户在合理时间内攫取、管理、处理、整理海量数据,为企业 阅读全文
posted @ 2016-04-11 21:47 xxxxxxxx1x2xxxxxxx 阅读(412) 评论(0) 推荐(0)

摘要: 关于举办大数据处理技术培训的通知 各有关单位: 中国科学院计算技术研究所是国家专门的计算技术研究机构,同时也是中国信息化建设的重要支撑单位,中科院计算所培训中心是致力于高端IT类人才培养及企业内训的专业培训机构。中心凭借科学院的强大师资力量,在总结多年大型软件开发和组织经验的基础上,自主研发出一整套 阅读全文
posted @ 2016-04-11 21:47 xxxxxxxx1x2xxxxxxx 阅读(230) 评论(0) 推荐(0)

摘要: 成都大数据Hadoop与Spark技术培训班 中国信息化培训中心特推出了大数据技术架构及应用实战课程培训班,通过专业的大数据Hadoop与Spark技术架构体系与业界真实案例来全面提升大数据工程师、开发设计人员的工作水平,旨在培养专业的大数据Hadoop与Spark技术架构专家,更好地服务于各个行业 阅读全文
posted @ 2016-04-11 21:46 xxxxxxxx1x2xxxxxxx 阅读(315) 评论(0) 推荐(0)

摘要: 原文 http://datameng.com/info/2014/03/big-data-xinwen-caibian/ 据统计,到2013年,全世界储存的信息如果记录在光盘上,再把这些光盘叠加起来,高度等于从地球到月球的距离。美国互联网数据中心指出,目前世界 上90%以上的数据是近几年才产生的。互 阅读全文
posted @ 2016-04-11 21:45 xxxxxxxx1x2xxxxxxx 阅读(260) 评论(0) 推荐(0)

摘要: 随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据 的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具,首选的是Hadoop/Yarn平台,但目前对大数据的实时分析工具,业界 阅读全文
posted @ 2016-04-11 21:43 xxxxxxxx1x2xxxxxxx 阅读(492) 评论(0) 推荐(0)

摘要: EXCEL常用函数序号 分类 函数名称及链接 语法 作用和功能 应用及备注1 日期与时间函数 DATE date(year,month,day) 返回特定的日期序列号2 EDATE edate(start_date,months) 按指定日期上下推月份并回到相应日期3 DATEVALUE datev 阅读全文
posted @ 2016-04-11 21:43 xxxxxxxx1x2xxxxxxx 阅读(267) 评论(0) 推荐(0)

摘要: 老师简介: Gino老师,即将步入不惑之年,早年获得名校数学与应用数学专业学士和统计学专业硕士,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。 曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数, 阅读全文
posted @ 2016-04-11 21:41 xxxxxxxx1x2xxxxxxx 阅读(618) 评论(0) 推荐(0)

摘要: Apache Hadoop Hadoop现在已经进入第二个10年发展期了, 但不可否认的是, Hadoop在2014年出现了井喷式发展, 由于Hadoop从测试集群向生产和软件供应商方向不断转移, 其越来越接近于分布式存储和处理机架构, 因此, 这一势头在2015年会更加猛烈。由于大数据平台的强大, 阅读全文
posted @ 2016-04-11 21:40 xxxxxxxx1x2xxxxxxx 阅读(217) 评论(0) 推荐(0)