上一页 1 ··· 74 75 76 77 78 79 80 81 82 ··· 111 下一页

2013年5月14日

摘要: 成堆的数据如何变成信息金矿Andrew Glover, 作家和开发人员, Beacon50简介: Apache Hadoop 是目前分析分布式数据的首选工具,和大多数 Java™ 2.0 技术一样,是可扩展的。从... 阅读全文
posted @ 2013-05-14 22:52 Java码界探秘 阅读(260) 评论(0) 推荐(0)
摘要: 如何开始使用 Hadoop 和自己喜欢的数据库Marty Lurie, 系统工程师, IBM简介: 本文的重点是解释大数据,然后在 Hadoop 中提供简单的工作示例,Hadoop 是在大数据领域的主要开源选手。... 阅读全文
posted @ 2013-05-14 22:46 Java码界探秘 阅读(129) 评论(0) 推荐(0)
摘要: 1. 大数据大数据 是指变得过大而无法通过传统方法操纵的数据集。这些方法包括在可承受的时间内对数据进行捕获、存储和处理。虽然术语大数据 曾被用作数据仓库概念,但它现在只专注于处理的容量、吞吐量和通用性的大规模处理... 阅读全文
posted @ 2013-05-14 22:34 Java码界探秘 阅读(219) 评论(0) 推荐(0)
摘要: 使用典型 Linux 系统上的 Hadoop 从日志中提取有用数据M. Tim Jones, 独立作家, 顾问简介: 日志是任何计算系统中一个必不可少的部分,支持从审计到错误管理等功能。随着日志的发展和日志来源数... 阅读全文
posted @ 2013-05-14 22:32 Java码界探秘 阅读(176) 评论(0) 推荐(0)
摘要: http://blog.csdn.net/sunboy_2050/article/details/6252552 如果安装了JDK,会发同你的电脑有两套JRE,一套位于 /jre 另外一套位于 C:/Progra... 阅读全文
posted @ 2013-05-14 22:10 Java码界探秘 阅读(80) 评论(0) 推荐(0)
摘要: 1.wordcount的代码如下public class WordCount{ public static class TokenizerMapper extends Mapper { ... 阅读全文
posted @ 2013-05-14 22:04 Java码界探秘 阅读(116) 评论(0) 推荐(0)
摘要: 读者是没有耐心的,我也没有,所以先说结论:你可以不用编程序,只要鼠标点几下拖动些图标,改改参数,就能完成过亿数据的分布处理程序。当然,这么理想的目标现在还没有达到,但路已经明明白白的展现在面前了,至少我们已经走了... 阅读全文
posted @ 2013-05-14 22:00 Java码界探秘 阅读(142) 评论(0) 推荐(0)
摘要: 本文介绍几种MapReduce算法设计的技巧,全部内容翻译自《Data-Intensive Text Processing with MapReduce》。Local Aggregation说到Local Agg... 阅读全文
posted @ 2013-05-14 21:59 Java码界探秘 阅读(108) 评论(0) 推荐(0)
摘要: 本文译自 Mapreduce Patterns, Algorithms, and Use Cases在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法,并系统化的解释了这些技术的不同之处。所有... 阅读全文
posted @ 2013-05-14 21:59 Java码界探秘 阅读(200) 评论(0) 推荐(0)
摘要: 安装Java JDK:到sun网站上下载jdkchmod +x jdk-6u30-linux-x64.bin./jdk-6u30-linux-x64.bin 下载Hadoopwget http://labs.re... 阅读全文
posted @ 2013-05-14 20:46 Java码界探秘 阅读(137) 评论(0) 推荐(0)
上一页 1 ··· 74 75 76 77 78 79 80 81 82 ··· 111 下一页

导航