大葱拌豆腐 - 博客园

2018年12月23日

摘要： T:ClassTag的例子（根据输入动态定义）命令行代码：阅读全文

posted @ 2018-12-23 14:10 大葱拌豆腐阅读(5829) 评论(0) 推荐(2)

2018年12月21日

摘要： 1.构造器在Scala中，每个类都有一个主构造器。主构造器与类的定义交织在一起，如下：主构造器会执行类定义中的所有语句。如下，println语句是主构造器的一部分，当类被实例化时，println语句会立即执行。通过把private修饰符添加在类参数列表的前边把主构造器隐藏起来。如：这样客户代阅读全文

posted @ 2018-12-21 22:55 大葱拌豆腐阅读(393) 评论(0) 推荐(0)

2018年12月17日

Spark Sql数仓报-Metastore contains multiple versions

摘要： Spark版本为2.1.0，Hadoop版本为2.7.1，元数据存储在mysql中，异常信息如下：报错提示，hive metastore出现了多个版本，去hive的元数据库查看表VERSION，发现多了一条记录解决过程查资料 google了一些资料，网上也有人提过，如HIVE-9543，网上大阅读全文

posted @ 2018-12-17 22:09 大葱拌豆腐阅读(813) 评论(0) 推荐(0)

2018年12月9日

DataFrame WordCount

摘要：测试数据：打印结果：阅读全文

posted @ 2018-12-09 21:55 大葱拌豆腐阅读(726) 评论(0) 推荐(0)

2018年12月8日

Spark History Server产生背景

摘要：以standalone运行模式为例，在运行Spark Application的时候，Spark会提供一个WEBUI列出应用程序的运行时信息；但该WEBUI随着Application的完成(成功/失败)而关闭，也就是说，Spark Application运行完(成功/失败)后，将无法查看Applica 阅读全文

posted @ 2018-12-08 20:52 大葱拌豆腐阅读(494) 评论(0) 推荐(0)

2018年12月6日

Spring boot 整合hive-jdbc导致无法启动的问题

摘要：使用Spring boot整合Hive，在启动Spring boot项目时，报出异常：经过排查，是maven的包冲突引起的，具体做法，排除：jetty-all、hive-shims依赖包。对应的pom配置如下：阅读全文

posted @ 2018-12-06 18:27 大葱拌豆腐阅读(1636) 评论(0) 推荐(1)

2018年12月2日

Exception in thread “main” java.sql.SQLException: No suitable driver

摘要：问题背景：通过Spark SQL的jdbc去读取Oracle数据做测试，在本地的idea中没有报任务错误。但是打包到集群的时候报：测试代码：在本地测试通过，服务器会报如上截图的错误。最后通过排查发现是少了一句要制定driver的类型阅读全文

posted @ 2018-12-02 14:21 大葱拌豆腐阅读(4068) 评论(0) 推荐(0)

2018年11月29日

Hive和SparkSQL：基于 Hadoop 的数据仓库工具

摘要： Hive 前言 Hive 是基于 Hadoop 的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的 SQL 查询功能，将类 SQL 语句转换为 MapReduce 任务执行。数据组织格式下面是直接存储在HDFS上的数据组织方式 Table：每个表存储在HDFS上的一个目录阅读全文

posted @ 2018-11-29 23:37 大葱拌豆腐阅读(1570) 评论(0) 推荐(0)

Spark配置参数

摘要：以下是整理的Spark中的一些配置参数，官方文档请参考Spark Configuration。 Spark提供三个位置用来配置系统： Spark属性：控制大部分的应用程序参数，可以用SparkConf对象或者Java系统属性设置环境变量：可以通过每个节点的conf/spark-env.sh脚本设置阅读全文

posted @ 2018-11-29 23:15 大葱拌豆腐阅读(573) 评论(0) 推荐(0)

spark on yarn任务提交缓慢解决

摘要： 1.为什么要让运行时Jar可以从yarn端访问spark2以后，原有lib目录下的大JAR包被分散成多个小JAR包，原来的spark-assembly-*.jar已经不存在每一次我们运行的时候，如果没有指定 spark.yarn.archive or spark.yarn.jars Spark将在阅读全文

posted @ 2018-11-29 22:54 大葱拌豆腐阅读(2326) 评论(0) 推荐(0)

公告