会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
滴水穿石不是靠力,而是因为不舍昼夜。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
32
33
34
35
36
37
38
39
40
···
45
下一页
2022年2月17日
hive on spark 读取中文乱码
摘要: 问题描述 集群默认计算引擎是 hive ,这两天自己试了一下 hive on spark 发现一个奇怪现象,首先 hive 引擎中文做简单查询或者聚合查询都正常,使用 spark 引擎简单查一个表的中文字段也没事,但是只要对 中文字段进行 group by 操作就乱码了 问题解决 在开启 spark
阅读全文
posted @ 2022-02-17 10:23 晓枫的春天
阅读(431)
评论(0)
推荐(0)
2022年2月16日
hive 分离字符串中的数字&字母
摘要: 需求 有一个字段有字母和数字组成,现要将字母和数字进行分离; portyarn8088manager porthdfs9820filse porthive10000query 要求输出结果 portyarn8088manager portyarnmanager 8088 porthdfs9820fi
阅读全文
posted @ 2022-02-16 12:22 晓枫的春天
阅读(1534)
评论(1)
推荐(0)
2022年2月15日
Flink Environment & Source
摘要: Environment Flink 可以在各种上下文环境中执行,不同的环境,代码提交的过程有所不同。这就要求在提交作业执行计算时,首先必须获取当前Flink的运行环境,从而建立起与Flink框架之间的联系,只有获取了上下文环境信息,才能将具体的任务调度到不同的TaskManager上执行。 1、创建
阅读全文
posted @ 2022-02-15 18:21 晓枫的春天
阅读(258)
评论(0)
推荐(0)
hive 实现行轮值
摘要: 需求 现需要返回每本小说的的iD,书名、评分,以及下一个比当前小说高和低的评分值。如果没有找到更高或更低的评分值,你希望结果集可以“折回”(第一个 score 的前一行是最后一个score;反之,最后一个 score 的下一行即是第一个 scoe)。你希望返回如下所示的结果集。 id name sc
阅读全文
posted @ 2022-02-15 12:09 晓枫的春天
阅读(66)
评论(0)
推荐(0)
2022年2月14日
Flink 实现 WordCount
摘要: pom.xml <properties> <flink.version>1.13.0</flink.version> <java.version>1.8</java.version> <scala.binary.version>2.12</scala.binary.version> <slf4j.v
阅读全文
posted @ 2022-02-14 11:14 晓枫的春天
阅读(524)
评论(0)
推荐(0)
hive 截取不固定位置字符串
摘要: 需求 日志表中有如下数据 film:[non_marked]qq:[unit]tailpipe:[withabanana?]80sxxxxx call:[F_GET_ROWS()]b1:[ROSEWOOD...SIR]b2:[44400002]77.90xxxxx xxxxxabc[867]xxx[
阅读全文
posted @ 2022-02-14 11:04 晓枫的春天
阅读(2013)
评论(0)
推荐(0)
2022年2月13日
hiveserver2 启动报错 Caused by: org.apache.hadoop.ipc.RemoteException: Cannot create directory /tmp/hive/hui/c054b89f-756e-41e5-bb1f-8e4abc389e29. Name node is in safe mode.
摘要: 报错 说是 hdfs 还处于安全模式 解决 hdfs dfsadmin -safemode leave 观察 hiveserver2 已正常 补充 hdfs 安全模式几个命令 hdfs dfsadmin -safemode get (功能描述:查看安全模式状态) hdfs dfsadmin -saf
阅读全文
posted @ 2022-02-13 18:34 晓枫的春天
阅读(141)
评论(0)
推荐(0)
hive 获取 json 中的 key
摘要: 需求 有一下 json 数组,要求获取其 key [{"title":"笑傲江湖","author":"金庸"},{"title":"流星蝴蝶剑","author":"古龙"}] 需求实现 1、首先将 json 数组转换为 字符串 ;这里使用 字符串替换函数 translate select tra
阅读全文
posted @ 2022-02-13 17:29 晓枫的春天
阅读(2468)
评论(0)
推荐(0)
hive 定位连续区间的起始位置和结束位置
摘要: 需求 id 是上表temp_id_list_0209的主键, 表每一行包含日志表中的一个 ID,现将一些 ID 从 Logs 表中删除。编写一个 SQL 查询得到 Logs 表中的连续区间的开始数字和结束数字,将查询表按照 start_id 排序。 要求输出结果为 start_id end_id 1
阅读全文
posted @ 2022-02-13 16:35 晓枫的春天
阅读(372)
评论(0)
推荐(0)
2022年2月11日
hive 用户行为路径分析
摘要: 需求 已知用户行为表 temp_actions_log, 大概字段有:(user_id 用户编号, op_id 操作编号, op_time 操作时间) 要求 统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻。 统计用户行为序列为A-B-D的用户数 其中:A-B之间可以有任何其他浏览
阅读全文
posted @ 2022-02-11 12:17 晓枫的春天
阅读(446)
评论(0)
推荐(0)
上一页
1
···
32
33
34
35
36
37
38
39
40
···
45
下一页
公告