随笔分类 - spark
摘要:1.全部代码不再粘贴,只粘贴主要代码。spark streaming主方法代码 主方法入hbase(和上面的代码片段在一个文件里) 2.DataBaseOperation类 另一个对象文件 上面是传一个machno作为数据的关联。只获取了一个字符串,下面另一个案例是传一个Map 1.主函数 2.主要
阅读全文
摘要:1.window滑动窗口操作 2.output操作
阅读全文
摘要:在提交spark-submit时添加参数即可 这个gc.log在集群上不一定在那个节点上,需要自己找,然后查看 查看日志监控:tail -f gc.log
阅读全文
摘要:DataFrame 的函数 Action 操作 1、 collect() ,返回值是一个数组,返回dataframe集合所有的行 2、 collectAsList() 返回值是一个java类型的数组,返回dataframe集合所有的行 3、 count() 返回一个number类型的,返回dataf
阅读全文
摘要:1.代码 2.代码 Dateset两个表进行连接 3.代码 4.代码 5.聚合函数 6.代码 7.其他函数要查官网
阅读全文
posted @ 2018-08-23 18:29
聚云
摘要:Dateframe与DateSet使用 1.代码 2.测试用例 {"name": "Leo", "age": 25, "depId": 1, "gender": "male", "salary": 20000} {"name": "Marry", "age": 30, "depId": 2, "ge
阅读全文
posted @ 2018-08-23 17:01
聚云
浙公网安备 33010602011771号