2014年2月18日
摘要: 使用sqoop把mysql数据导入hiveexport HADOOP_COMMON_HOME=/hadoopexport HADOOP_MAPRED_HOME=/hadoopcp /hive/lib/mysql-connector-java-5.1.25-bin.jar /sqoop/lib/share表第一列为自增主键 share_id,share_id SELECT COUNT(*) FROM share WHERE share_id select add_time from share limit 1;+---------------------+| add_time ... 阅读全文
posted @ 2014-02-18 14:40 刀锋诚心 阅读(897) 评论(0) 推荐(0) 编辑
摘要: http://abloz.com/hbase/book.html#d613e75 阅读全文
posted @ 2014-02-18 14:24 刀锋诚心 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 本文可以让刚接触pig的人对一些基础概念有个初步的了解。本文大概是互联网上第一篇公开发表的且涵盖大量实际例子的Apache Pig中文教程(由Google搜索可知),文中的大量实例都是作者Darran Zhang(website: codelast.com)在工作、学习中总结的经验或解决的问题,并且添加了较为详尽的说明及注解,此外,作者还在不断地添加本文的内容,希望能帮助一部分人。Apache pig是用来处理大规模数据的高级查询语言,配合Hadoop使用,可以在处理海量数据时达到事半功倍的效果,比使用Java,C++等语言编写大规模数据处理程序的难度要小N倍,实现同样的效果的代码量也小N倍。 阅读全文
posted @ 2014-02-18 14:12 刀锋诚心 阅读(493) 评论(0) 推荐(0) 编辑
摘要: Pig中的约定 阅读全文
posted @ 2014-02-18 13:56 刀锋诚心 阅读(271) 评论(0) 推荐(0) 编辑
摘要: http://my.oschina.net/leejun2005/blog/140462http://www.codelast.com/?p=3621&cpage=1#comment-361http://www.datalab.sinaapp.com/?p=128 阅读全文
posted @ 2014-02-18 12:42 刀锋诚心 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 我们一直强调,大数据和传统的关系数据库并不对立,未来公司的的业务将会是大数据和关系型数据库的整合。微软的PolyBase打响了SQL Server和Hadoop整合的第一枪。在2012年度的SQL Server(PASS)峰会(SQL Server专业人士的技术会议)上,微软公布了代码名为”PolyBase”的新功能。微软鲜明地阐述了未来大数据和传统的关系数据库的紧密联系。微软或许不是第一个试图整合关系型数据库和Hadoop的公司,但毫无疑问将会是最具冲击力的一个。PolyBase 将于 2013 年上半年中发布,作为SQL 服务器 PDW 的下一个版本的一部分。PDW是SQL Server数 阅读全文
posted @ 2014-02-18 12:38 刀锋诚心 阅读(3731) 评论(0) 推荐(1) 编辑