会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Protect_Winter's Sketchbook
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
8
9
···
16
下一页
2021年1月18日
1.18学习总结:Spark向HBase写入数据
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=39 二、编写程序
阅读全文
posted @ 2021-01-18 14:23 Protect_Winter
阅读(81)
评论(0)
推荐(0)
2021年1月17日
1.17学习总结:编写程序读取HBase数据
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=36 二、遇到的问题 在新建HBase表时报错:KeeperErrorCode=Connection for /hbase 解决方法: 三、Spark读取HBase
阅读全文
posted @ 2021-01-17 11:17 Protect_Winter
阅读(100)
评论(0)
推荐(0)
2021年1月16日
1.16学习总结:Spark读写Hbase数据_配置Spark
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=37 二、配置过程 2.1在spark安装目录下的jars目录中新建hbase目录 2.2将hbase安装目录下的lib目录下的相关文件拷贝到上面的hbase文件夹中 注:./代表当前文件夹,之
阅读全文
posted @ 2021-01-16 15:33 Protect_Winter
阅读(323)
评论(0)
推荐(0)
2021年1月15日
1.15学习总结:HBase简介
摘要: 一、HBase简介 HBase是一个基于Hdfs的、分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBa
阅读全文
posted @ 2021-01-15 12:45 Protect_Winter
阅读(151)
评论(0)
推荐(0)
2021年1月14日
1.14学习总结:数据读写
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=34 二、本地文件数据读写 2.1 读取本地文件数据创建RDD,注:基于RDD惰性机制,即便文件不存在也不会报错,只会在遇到第一个动作操作时报错 2.2 将RDD写入本地文件系统,注:saveA
阅读全文
posted @ 2021-01-14 10:31 Protect_Winter
阅读(56)
评论(0)
推荐(0)
2021年1月13日
1.13学习总结:键值对RDD
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=31 二、键值对RDD的创建 使用map()函数,将读取的数据分割成键值对的形式 三、常用键值对RDD转换操作 1.reduceByKey(func) 使用func函数合并具有相同键的值 2.g
阅读全文
posted @ 2021-01-13 17:46 Protect_Winter
阅读(196)
评论(0)
推荐(0)
2021年1月12日
1.12学习总结:分区
摘要: 一、学习视频 https://www.bilibili.com/video/BV1oE411s7h7?p=27 二、分区的作用 1.增加并行度 2.减少通信开销 三、自定义分区方法 调用SparkContext对象的.textFile()或者.parallelize()方法,在方法内传递两个参数,第
阅读全文
posted @ 2021-01-12 12:23 Protect_Winter
阅读(91)
评论(0)
推荐(0)
2021年1月11日
1.11学习总结:持久化
摘要: 一、持久化 多次计算时,可能会重复利用一个数值,每次需要从头到尾的计算得出这个数值较为麻烦,所以可以将此RDD持久化,直接使用 二、实例 在此代码中,第一次执行计算是rdd.count()函数,当执行到rdd.collect()时,会重复执行之前的代码,rdd会被重复生成并计算 三、持久化方式 可以
阅读全文
posted @ 2021-01-11 17:56 Protect_Winter
阅读(84)
评论(0)
推荐(0)
2021年1月10日
1.10学习总结:RDD的行动操作
摘要: 一、典型的行动操作 (1)count():返回数据集中元素个数 (2)collect():以数组的形式返回数据集中所有元素 (3)first():返回数据集中第一元素 (4)take(n):以数组的形式返回数据集中前n个元素 (5)reduce(func):通过函数func聚合数据集中的元素 (6)
阅读全文
posted @ 2021-01-10 14:14 Protect_Winter
阅读(230)
评论(0)
推荐(0)
2021年1月9日
1.9学习总结:RDD的转换操作
摘要: 一、惰性机制 RDD的惰性机制:RDD在进行转换时,只记录转换的轨迹,不发生计算,直到遇到第一个动作类型操作时,才进行计算。 二、常用的转换操作 (1)filter filter(func):提供一个函数,过滤掉不符合这个函数的元素,筛选出符合的并返回一个新的数据集 (2)map map(func)
阅读全文
posted @ 2021-01-09 15:23 Protect_Winter
阅读(733)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
16
下一页
公告