会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
滴水穿石不是靠力,而是因为不舍昼夜。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
34
35
36
37
38
39
40
41
42
···
45
下一页
2022年1月29日
关于 hive 特殊字段的应用举例
摘要: 建表 create table temp.jc_t_test_map_array ( id int, name string, hobby array<string>, -- array中元素为string类型 friend map<string,string>, -- map中键和值均为strin
阅读全文
posted @ 2022-01-29 18:22 晓枫的春天
阅读(95)
评论(0)
推荐(0)
2022年1月26日
关于 Hive 空值过多引起的数据倾斜的两种解决方案
摘要: 场景 有木有发现工作中偶尔有些大量的null值或者一些无意义的数据参与到计算作业中,任务跑的贼慢,表中有大量的null值,如果表之间进行join关联操作,就会有shuffle产生,这样所有的null值都会集中在一个reduce中,会产生数据倾斜,降低作业效率。辣么我们该如何避免这种囧况呢,现在给大家
阅读全文
posted @ 2022-01-26 17:32 晓枫的春天
阅读(1304)
评论(0)
推荐(0)
2022年1月25日
Hive nvl 和 coalesce 的使用
摘要: nvl 和 coalesce 说明 nvl 和 coalesce 是 HSQL 中常用的 空值处理函数,今天给大家聊聊这两个函数的使用细节、 数据准备 先建表插入两条测试数据 create table temp.jc_test_coalesce_nvl ( c1 int, c2 int, c3 in
阅读全文
posted @ 2022-01-25 17:43 晓枫的春天
阅读(5940)
评论(1)
推荐(0)
2022年1月17日
service mysqld restart mysqld: 未被识别的服务
摘要: 问题描述 由于更改了 /etc/my.cnf 需要重启下 mysql 服务,但是重启服务报错了: 经过多发查询发现遇到这样的错误,是由于 /etc/init.d/ 不存在 mysqld 这个命令(有的人安装完环境后存在,是因为你的安装包中有这样的命令将 mysql.server 文件 copy 到
阅读全文
posted @ 2022-01-17 06:17 晓枫的春天
阅读(1013)
评论(0)
推荐(0)
2022年1月6日
Kafka 启动失败,报错Corrupt index found以及org.apache.kafka.common.protocol.types.SchemaException: Error reading field 'version': java.nio.BufferUnderflowException
摘要: 今天启动kafka 后 发现只有一个节点启动成功,另两个节点启动失败,查看日志如下 经多方查验,原来是之前未正常关闭服务导致 解决方案 根据日志提示,我们需要手动删除每个partition下的 两个索引文件, 重新启动集群,kafka会自动重建索引文件 find /opt/module/kafka/
阅读全文
posted @ 2022-01-06 23:14 晓枫的春天
阅读(903)
评论(0)
推荐(0)
2021年12月21日
centos 6.8 yum源不可用安装报YumRepo Error: All mirror URLs are not using ftp, http[s] or file
摘要: 问题场景 今天在给环境装插件的时候,yum 提示报错如图: 经过查询发现是自己的 yum 源有问题 处理方案 //删除yum.repos.d目录下所有文件 rm -f /etc/yum.repos.d /* // 重新下载 wget -O /etc/yum.repos.d/CentOS-Base.r
阅读全文
posted @ 2021-12-21 15:13 晓枫的春天
阅读(330)
评论(0)
推荐(0)
2021年12月20日
SpringBoot 打包出错 Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-res
摘要: 问题描述 springboot 应用程序打包报错: Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-res 原因分析 plugins标签里面缺少maven-
阅读全文
posted @ 2021-12-20 23:07 晓枫的春天
阅读(296)
评论(0)
推荐(0)
Spark 版本 WordCount
摘要: 一、环境准备 今天我们看下Spark 版本的 wordcount,IDEA 新建 Maven 项目引入依赖:使用 spark 3.0.0,对应scala 版本2.12 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark
阅读全文
posted @ 2021-12-20 16:43 晓枫的春天
阅读(183)
评论(0)
推荐(0)
Spark初识
摘要: 一、Spark 是什么 Spark官网地址:https://spark.apache.org Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的 MapReduce 计算模型。高效的支撑更多计算模式,包括交互式查询和流处理。
阅读全文
posted @ 2021-12-20 15:55 晓枫的春天
阅读(103)
评论(0)
推荐(0)
2021年12月19日
斐波那契数列的两种实现方式
摘要: 1、斐波那契数列是什么 斐波那契数列,也称之为斐波那契数,指的是这样一个数列:0、1、1、2、3、5、8、13、21、……在数学上,斐波那契数列以如下被以递归的方法定义:F0=0,F1=1,Fn=Fn-1+Fn-2(n>=2,n∈N*),用文字来说,就是斐波那契数列由 0 和 1 开始,之后的斐波那
阅读全文
posted @ 2021-12-19 20:28 晓枫的春天
阅读(343)
评论(0)
推荐(0)
上一页
1
···
34
35
36
37
38
39
40
41
42
···
45
下一页
公告