会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
信方互联网硬汉
行走互联,硬汉信方
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
16
17
18
19
20
21
22
23
24
···
39
下一页
2017年12月11日
Spark记录-SparkSQL远程操作MySQL和ORACLE
摘要: 1.项目引入mysql和oracle驱动 2.将mysql和oracle驱动上传到hdfs 3.远程调试源代码如下:
阅读全文
posted @ 2017-12-11 15:24 信方
阅读(4105)
评论(0)
推荐(0)
2017年12月8日
Spark记录-Spark on Yarn框架
摘要: 一、客户端进行操作 1、根据yarnConf来初始化yarnClient,并启动yarnClient2、创建客户端Application,并获取Application的ID,进一步判断集群中的资源是否满足executor和ApplicationMaster申请的资源,如果不满足则抛出IllegalA
阅读全文
posted @ 2017-12-08 14:31 信方
阅读(551)
评论(0)
推荐(0)
2017年12月7日
Linux记录-重启后磁盘丢失问题解决方案
摘要: 1.df -TH 查看挂载情况 2.fdisk -l 查看磁盘情况 3.blkid 查看磁盘文件系统 4.vim /etc/fstab 加入 /dev/xvdf ext4 defaults 0 0 5.保存重启,查看df -TH
阅读全文
posted @ 2017-12-07 15:46 信方
阅读(6332)
评论(0)
推荐(0)
2017年12月6日
Spark记录-阿里巴巴开源工具DataX数据同步工具使用
摘要: 1.官网下载 下载地址:https://github.com/alibaba/DataX DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、M
阅读全文
posted @ 2017-12-06 16:25 信方
阅读(1981)
评论(0)
推荐(0)
Spark记录-SparkSql官方文档中文翻译(部分转载)
摘要: 1 概述(Overview) Spark SQL是Spark的一个组件,用于结构化数据的计算。Spark SQL提供了一个称为DataFrames的编程抽象,DataFrames可以充当分布式SQL查询引擎。 2 DataFrames DataFrame是一个分布式的数据集合,该数据集合以命名列的方
阅读全文
posted @ 2017-12-06 10:55 信方
阅读(2360)
评论(0)
推荐(0)
2017年12月5日
Spark记录-SparkSQL一些操作
摘要: scala>val spark=new org.apache.spark.sql.SQLContext(sc) user.json {"age":"45","gender":"M","occupation":"7","userID":"4","zipcode":"02460"}{"age":"1",
阅读全文
posted @ 2017-12-05 15:49 信方
阅读(4935)
评论(0)
推荐(0)
Spark记录-Spark-Shell客户端操作读取Hive数据
摘要: 1.拷贝hive-site.xml到spark/conf下,拷贝mysql-connector-java-xxx-bin.jar到hive/lib下 2.开启hive元数据服务:hive --service metastore 3.开启hadoop服务:sh $HADOOP_HOME/sbin/st
阅读全文
posted @ 2017-12-05 11:10 信方
阅读(8528)
评论(0)
推荐(0)
2017年12月4日
Spark记录-SparkSQL相关学习
摘要: $spark-sql --help 查看帮助命令 $设置任务个数,在这里修改为20个 spark-sql>SET spark.sql.shuffle.partitions=20; $选择数据库 spark-sql>use siat; $查询数据表 spark-sql>select * from te
阅读全文
posted @ 2017-12-04 10:02 信方
阅读(983)
评论(0)
推荐(0)
2017年11月23日
Spark记录-Scala程序例子(函数/List/match/option/泛型/隐式转换)
摘要: object func { def main(args:Array[String]):Unit={ //函数赋值给变量时, 必须在函数后面加上空格和下划线。 def sayHello(name: String) { println("Hello, " + name) } val sayHelloFu
阅读全文
posted @ 2017-11-23 10:35 信方
阅读(1326)
评论(0)
推荐(0)
2017年11月22日
CM记录-升级Spark版本到2.x(转载)
摘要: ①csd包:http://archive.cloudera.com/spark2/csd/ 下载SPARK2_ON_YARN-2.2.0.cloudera1.jar ②parcel包:http://archive.cloudera.com/spark2/parcels/2.2.0.cloudera1
阅读全文
posted @ 2017-11-22 15:35 信方
阅读(1048)
评论(0)
推荐(0)
上一页
1
···
16
17
18
19
20
21
22
23
24
···
39
下一页
公告