会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Arthur-Lance
博客园
首页
新随笔
联系
订阅
管理
2019年5月19日
和弦入门
摘要:
阅读全文
posted @ 2019-05-19 00:43 Arthur-Lance
阅读(125)
评论(0)
推荐(0)
2019年5月15日
c大调练习
摘要:
阅读全文
posted @ 2019-05-15 23:46 Arthur-Lance
阅读(181)
评论(0)
推荐(0)
2019年5月12日
吉他左右手练习
摘要: 如图:
阅读全文
posted @ 2019-05-12 12:34 Arthur-Lance
阅读(168)
评论(0)
推荐(0)
2019年4月15日
spark sql 加载数据
摘要: Load Data1) RDD DataFrame/Dataset2) Local Cloud(HDFS/S3) 将数据加载成RDDval masterLog = sc.textFile("file:///Users/arthurlance/app/spark-2.2.0-bin-2.6.0-cdh
阅读全文
posted @ 2019-04-15 22:49 Arthur-Lance
阅读(764)
评论(0)
推荐(0)
2019年4月14日
压缩格式介绍
摘要: 1.类型 2.压缩比
阅读全文
posted @ 2019-04-14 18:19 Arthur-Lance
阅读(288)
评论(0)
推荐(0)
2019年4月12日
Spark On Yarn 运行模式
摘要: 在Spark中,支持4种运行模式:1)Local:开发时使用2)Standalone: 是Spark自带的,如果一个集群是Standalone的话,那么就需要在多台机器上同时部署Spark环境3)YARN:建议大家在生产上使用该模式,统一使用YARN进行整个集群作业(MR、Spark)的资源调度4)
阅读全文
posted @ 2019-04-12 22:48 Arthur-Lance
阅读(675)
评论(0)
推荐(0)
2019年3月30日
hadoop离线数据处理架构
摘要: 数据处理流程1)数据采集 Flume: web日志写入到HDFS 2)数据清洗 脏数据 Spark、Hive、MapReduce 或者是其他的一些分布式计算框架 清洗完之后的数据可以存放在HDFS(Hive/Spark SQL) 3)数据处理 按照我们的需要进行相应业务的统计和分析 Spark、Hi
阅读全文
posted @ 2019-03-30 22:11 Arthur-Lance
阅读(854)
评论(0)
推荐(0)
列式存储与行式存储的区别
摘要:
阅读全文
posted @ 2019-03-30 19:07 Arthur-Lance
阅读(807)
评论(0)
推荐(0)
Spark操作外部数据源--MySQL
摘要: 操作MySQL的数据:spark.read.format("jdbc").option("url", "jdbc:mysql://localhost:3306/sparksql").option("dbtable", "sparksql.TBLS").option("user", "root").o
阅读全文
posted @ 2019-03-30 18:09 Arthur-Lance
阅读(487)
评论(0)
推荐(0)
Spark操作外部数据源--parquet
摘要: 处理parquet数据 RuntimeException: file:/Users/arthurlance/app/spark-2.2.0-bin-2.6.0-cdh5.7.0/examples/src/main/resources/people.json is not a Parquet file
阅读全文
posted @ 2019-03-30 18:08 Arthur-Lance
阅读(579)
评论(0)
推荐(0)
下一页
公告