Hadoop develop

博学笃志,切问近思,此八字,是收放心的工夫。 神闲气静,智深勇沉,此八字,是干大事的本领。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 19 下一页

2014年9月9日

摘要: 本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。1.初级入门《An Introduction to R》,这是官方的入门小册子。其有中文版,由丁国徽翻译,译名为《R导论》。《R4Beginners》,这本小册子有中文版应该叫《R入门》。除此之外,还可以去... 阅读全文
posted @ 2014-09-09 22:56 张子良 阅读(713) 评论(0) 推荐(0) 编辑

2014年8月23日

摘要: hadoop eclipse plugin插件源码编译和Eclipse安装配置 阅读全文
posted @ 2014-08-23 17:36 张子良 阅读(1233) 评论(0) 推荐(1) 编辑

2014年7月20日

摘要: phoenix psqlline使用过程中,使用CRT客户端,命令输入后无法删除,想起曾经处理HBaseShell输入后无法删除的解决办法,尝试了一下,居然有效,还是分享给大家把。 阅读全文
posted @ 2014-07-20 11:06 张子良 阅读(869) 评论(0) 推荐(1) 编辑

2014年6月25日

摘要: 一、引言: 最近一直很忙,在做一个全国性项目的IT架构,所以一直没有更新,好在算是告一段落,继续努力吧。项目沟通中过程客户反复在强调,大数据的安全性,言下之意,用了大数据,就不安全了,就有漏洞了。所以花了些时间,针对大数据的安全设计做了一个总结,算是阶段性的成果吧,分享给大家。二、安全架构 大数... 阅读全文
posted @ 2014-06-25 09:44 张子良 阅读(3441) 评论(6) 推荐(7) 编辑

2014年5月26日

摘要: earn essential techniques from data warehouse legend Bill Inmon on how to build the reporting environment your business needs now! Answers for many valuable business questions hide in text. How well can your existing reporting environment extract the necessary text from email, spreadsheets, and documents, and put it in a useful format for analytics and reporting? Transforming the traditional data warehouse into an efficient unstructured data warehouse requires additional skills from the analy 阅读全文
posted @ 2014-05-26 13:07 张子良 阅读(601) 评论(0) 推荐(0) 编辑

2014年5月22日

摘要: Hadoop的核心处理模块是MapReduce,也是当前最流行的大数据处理架构之一。 它能够将Hadoop数据存储无缝的融入到数据处理当中,使得它在操作上足够简单,功能上足够强大。MapReduce已经解决很多实际问题(从日志分析,到数据排序,到文本操作,到基于模式的搜索,到图像处理,到机器学习等等)。似乎每周都会出现有关MapReduce新应用的出现。在本章,你将要学习MapReduce的今本原理,包括它的主要部件,MapReduce应用的执行过程与[sht1] 如何设计MapReduce应用 阅读全文
posted @ 2014-05-22 09:25 张子良 阅读(4621) 评论(0) 推荐(3) 编辑

2014年5月10日

摘要: 技术能力到业务价值的转化,是当今大数据传统行业实践面临的首要问题,经过这些年的发展大数据平台本身已经相对成熟,已经基本具备生产应用的可能。从实际项目的实践情况来看,成熟的也仅限平台框架本身,应用支撑实施工具层面的匮乏,使得大数据技术的企业应用很难做到如传统SQL技术一样的工程化,易用化。目前大部分厂家将注意力放在平台管理工具的开发上面,如Cloudera manager等,而没有将关注点放到企业实施的工具化,可视化等方面,从而造成了大数据项目在工程化和可交付方面的不足。大数据项目的建设是厂商、开发是厂商、管理是厂商、维护也是厂商,最终用户始终无法接手系统,这是目前比较突出的问题。 阅读全文
posted @ 2014-05-10 10:12 张子良 阅读(1158) 评论(0) 推荐(3) 编辑

2014年4月23日

摘要: 基于Hive+Hadoop模式构建数据仓库,是大数据时代的一个不错的选择,本文以郑商所每日交易行情数据为案例,探讨数据Hive数据导入的操作实例。 阅读全文
posted @ 2014-04-23 18:47 张子良 阅读(2321) 评论(0) 推荐(0) 编辑

2014年4月18日

摘要: FS-LDM 金融11个主题模型,大数据技术构建国家级、行业级信息中心的应用逐渐普遍,大数据只是技术而非解决方案,数据中心同样面临数据如何组织?数据逻辑模型如何构建的问题。 阅读全文
posted @ 2014-04-18 08:25 张子良 阅读(2408) 评论(0) 推荐(1) 编辑

2014年4月14日

摘要: 从对大数据的狂热到理性的回归,项目实施起到了醍醐灌顶的作用,大数据技术只能作为一种IT基础架构(存储+运算),而实际的工程化实施,还是要回归到IT传统技术,最近在整合大数据时代的数据仓库框架,希望能有更多的人参与进来。数据仓库实施数据模型的组织,需要引入更多的规则,下面要谈的就是数据仓库数据内容的组织方式。来自TD,可以借鉴到大数据时代的数据仓库建设。 阅读全文
posted @ 2014-04-14 10:20 张子良 阅读(2022) 评论(0) 推荐(3) 编辑

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 19 下一页