Fork me on GitHub

随笔分类 -  BigData

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术.
摘要:世界的大数据包含一个庞大而充满活力的生态系统,但一个开放源码项目上面有这一切,那就是 Hadoop 的王朝。 Hadoop 是事实上的标准的分布式的数据运算。Hadoop 提供了一个 MapReduce 框架编写的应用程序处理大量的结构化和半结构化数据并行跨大型集群的机器以非常可靠和容错的方式。此外... 阅读全文
posted @ 2013-10-20 07:29 张善友 阅读(1716) 评论(0) 推荐(0) 编辑
摘要:Windows AzureHDInsight 提供了运行 Apache Hadoop的动态供应群集来处理大数据(Big Data)的能力。您可以在这个系列的第一篇博客中找到更多信息,您也可以点击这里开始在Windows Azure 门户网站中使用它。这篇文章列举了开发人员与HDInsight交互的几种不同方法,首先通过讨论不同的场景,然后深入讨论 HDInsight 中各种不同的功能。因为我们的产... 阅读全文
posted @ 2013-04-04 21:55 张善友 阅读(7526) 评论(0) 推荐(0) 编辑
摘要:SQL Server 2012与SQL Server 2008最重要的区别之一就是与Hadoop的兼容性。Hadoop允许用户处理大量的结构化和非结构化数据并快速从中获得观点,而且,因为Hadoop是开源的,成本较低。Hadoop与SQL Server 2012兼容的特性是微软与Hortonworks合作开发的,微软最近也宣布Microsoft HDInsight Server和Windows A... 阅读全文
posted @ 2013-01-31 20:05 张善友 阅读(3534) 评论(0) 推荐(0) 编辑
摘要:本文转自IBM的developerWorks,主题是关于使用NoSQL存储和处理大规模数据,文章列举了一些循序渐进的学习资料,包括了视频音频和文字材料,是一个很不错的了解、学习NoSQL的知识向导。 ... 阅读全文
posted @ 2012-06-08 06:49 张善友 阅读(2018) 评论(0) 推荐(1) 编辑
摘要:SQL Server 2012致力提供大规模且低成本的分析数据和数据仓库解决方案,并保证实现规模化和灵活性。在大数据时代Microsoft也做出了一些完善。 结构化、非结构化、实时数据 ●支持多格... 阅读全文
posted @ 2012-06-07 21:07 张善友 阅读(1893) 评论(0) 推荐(0) 编辑
摘要:微软的首席StreamInsight™ 项目经理发布的一篇博客 Big Data, Hadoop and StreamInsight™,微软的大数据解决方案中包含 Microsoft StreamI... 阅读全文
posted @ 2012-05-26 19:11 张善友 阅读(1055) 评论(0) 推荐(0) 编辑