会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
大葱拌豆腐
专注于Spark、Flink、Kafka、HBase、大数据、机器学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
8
9
10
11
12
13
14
15
16
···
45
下一页
2018年12月23日
Scala泛型[T]的使用
摘要: T:ClassTag的例子(根据输入动态定义) 命令行代码:
阅读全文
posted @ 2018-12-23 14:10 大葱拌豆腐
阅读(5825)
评论(0)
推荐(2)
2018年12月21日
Scala类的构造器与访问器
摘要: 1.构造器 在Scala中,每个类都有一个主构造器。主构造器与类的定义交织在一起,如下: 主构造器会执行类定义中的所有语句。如下,println语句是主构造器的一部分,当类被实例化时,println语句会立即执行。 通过把private修饰符添加在类参数列表的前边把主构造器隐藏起来。如: 这样客户代
阅读全文
posted @ 2018-12-21 22:55 大葱拌豆腐
阅读(388)
评论(0)
推荐(0)
2018年12月17日
Spark Sql数仓报-Metastore contains multiple versions
摘要: Spark版本为2.1.0,Hadoop版本为2.7.1,元数据存储在mysql中,异常信息如下: 报错提示,hive metastore出现了多个版本,去hive的元数据库查看表VERSION,发现多了一条记录 解决过程 查资料 google了一些资料,网上也有人提过,如HIVE-9543,网上大
阅读全文
posted @ 2018-12-17 22:09 大葱拌豆腐
阅读(808)
评论(0)
推荐(0)
2018年12月9日
DataFrame WordCount
摘要: 测试数据: 打印结果:
阅读全文
posted @ 2018-12-09 21:55 大葱拌豆腐
阅读(724)
评论(0)
推荐(0)
2018年12月8日
Spark History Server产生背景
摘要: 以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息;但该WEBUI随着Application的完成(成功/失败)而关闭,也就是说,Spark Application运行完(成功/失败)后,将无法查看Applica
阅读全文
posted @ 2018-12-08 20:52 大葱拌豆腐
阅读(488)
评论(0)
推荐(0)
2018年12月6日
Spring boot 整合hive-jdbc导致无法启动的问题
摘要: 使用Spring boot整合Hive,在启动Spring boot项目时,报出异常: 经过排查,是maven的包冲突引起的,具体做法,排除:jetty-all、hive-shims依赖包。对应的pom配置如下:
阅读全文
posted @ 2018-12-06 18:27 大葱拌豆腐
阅读(1631)
评论(0)
推荐(1)
2018年12月2日
Exception in thread “main” java.sql.SQLException: No suitable driver
摘要: 问题背景:通过Spark SQL的jdbc去读取Oracle数据做测试,在本地的idea中没有报任务错误。但是打包到集群的时候报: 测试代码: 在本地测试通过,服务器会报如上截图的错误。最后通过排查发现是少了一句要制定driver的类型
阅读全文
posted @ 2018-12-02 14:21 大葱拌豆腐
阅读(4057)
评论(0)
推荐(0)
2018年11月29日
Hive和SparkSQL:基于 Hadoop 的数据仓库工具
摘要: Hive 前言 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执行。 数据组织格式 下面是直接存储在HDFS上的数据组织方式 Table:每个表存储在HDFS上的一个目录
阅读全文
posted @ 2018-11-29 23:37 大葱拌豆腐
阅读(1563)
评论(0)
推荐(0)
Spark配置参数
摘要: 以下是整理的Spark中的一些配置参数,官方文档请参考Spark Configuration。 Spark提供三个位置用来配置系统: Spark属性:控制大部分的应用程序参数,可以用SparkConf对象或者Java系统属性设置 环境变量:可以通过每个节点的conf/spark-env.sh脚本设置
阅读全文
posted @ 2018-11-29 23:15 大葱拌豆腐
阅读(569)
评论(0)
推荐(0)
spark on yarn任务提交缓慢解决
摘要: 1.为什么要让运行时Jar可以从yarn端访问spark2以后,原有lib目录下的大JAR包被分散成多个小JAR包,原来的spark-assembly-*.jar已经不存在 每一次我们运行的时候,如果没有指定 spark.yarn.archive or spark.yarn.jars Spark将在
阅读全文
posted @ 2018-11-29 22:54 大葱拌豆腐
阅读(2320)
评论(0)
推荐(0)
上一页
1
···
8
9
10
11
12
13
14
15
16
···
45
下一页
公告