随笔分类 -  hadoop

摘要:#Spark入门#这个系列课程,是综合于我从2017年3月分到今年7月份为止学习并使用Spark的使用心得感悟,暂定于每周更新,以后可能会上传讲课视频和PPT,目前先在博客园把稿子打好。注意:这只是一个草稿,里面关于知识的误解还请各大网友监督,我们互相进步。总而言之,网络上的知识学会断舍离,学会带着 阅读全文
posted @ 2018-07-19 15:08 wing1995 阅读(50135) 评论(11) 推荐(9)
摘要:虽说,spark我也不陌生,之前一直用python跑的spark,基本的core和SQL操作用的也是比较熟练。但是这一切的基础都是在RDD上进行操作,即使是进行SQL操作也是将利用SpaekContext类中的textFile方法读取txt文件返回RDD对象,然后使用SQLContext实例化载利用 阅读全文
posted @ 2017-05-03 20:01 wing1995 阅读(2101) 评论(0) 推荐(0)
摘要:昨天成功运行第一个在hadoop集群上面的python版本的wordcount,今天白天继续看网上提供的文档。下午上头给定的回复是把hadoop家族都熟悉一下,那就恭敬不如从命,开始学习pig吧~ 这一年多的编程之路让我知道学习任何一门新的技术的最入门的方式就看文档,let's geting sta 阅读全文
posted @ 2016-01-26 20:41 wing1995 阅读(8191) 评论(2) 推荐(1)