上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 45 下一页
摘要: Spark运行模式概述 阅读全文
posted @ 2017-08-17 17:24 牵牛花 阅读(177) 评论(0) 推荐(0)
摘要: Spark下的PageRank实现 阅读全文
posted @ 2017-08-17 17:20 牵牛花 阅读(415) 评论(0) 推荐(0)
摘要: 1.在产生随机数时,在数据规模很大的时候很难出现自己要的模型,比如某个条件的数据量,此时要写一个方法,来造一批这样的数据 2.将控制数量,文件路径写成配置文件的形式,以免重复打包 3.输入输出文件夹,可以配置以免重复打包 阅读全文
posted @ 2017-08-17 01:12 牵牛花 阅读(155) 评论(0) 推荐(0)
摘要: jsonp http://blog.csdn.net/column/details/jsoup.html 阅读全文
posted @ 2017-08-16 23:30 牵牛花 阅读(1153) 评论(0) 推荐(0)
摘要: 一、回收站简介: 在HDFS里,删除文件时,不会真正的删除,其实是放入回收站/trash,回收站里的文件可以快速恢复。 可以设置一个时间阀值,当回收站里文件的存放时间超过这个阀值或是回收站被清空时,文件才会被彻底删除,并且释放占用的数据块。 二、实例: Hadoop的回收站trash功能默认是关闭的 阅读全文
posted @ 2017-08-16 19:32 牵牛花 阅读(276) 评论(0) 推荐(0)
摘要: Sparkstreaming reduceByKeyAndWindow(_+_, _-_, Duration, Duration) 的源码/原理解析 阅读全文
posted @ 2017-08-16 14:43 牵牛花 阅读(846) 评论(0) 推荐(0)
摘要: spark streaming updateStateByKey 用法 阅读全文
posted @ 2017-08-16 10:51 牵牛花 阅读(308) 评论(0) 推荐(0)
摘要: spark streaming kafka1.4.1中的低阶api createDirectStream使用总结 阅读全文
posted @ 2017-08-15 13:33 牵牛花 阅读(627) 评论(0) 推荐(0)
摘要: val updateFunc2 = (iter:Iterator[(String,Seq[Int],Option[Int])])=>{ iter.map{case (x,y,z) => //由于Some的get方法得到的还是一个Some.所以这里要在用一个get方法 //,如果最开始的时候用的时flatmap那么这里就不用调用get方法,这里可以推测出Flat... 阅读全文
posted @ 2017-08-15 10:39 牵牛花 阅读(285) 评论(0) 推荐(0)
摘要: package my.bigdata.movieTask.action; import com.alibaba.fastjson.JSON; import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObject; import java.util.ArrayList; import java.util.Ha... 阅读全文
posted @ 2017-08-14 22:44 牵牛花 阅读(735) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 45 下一页