会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
日拱一卒
博客园
首页
新随笔
联系
订阅
管理
2023年6月19日
一、基础知识
摘要: 一、标识符 标识符:就是对变量、常量、函数、类等对象起的名字 Python语音在任何场景都严格区分大小写! Python对于标识符的命名有如下的规定: 第一个字符必须是字母表中的字母或下划线‘_’ ,标识符的其他的部分由字母、数字和下划线组成a,AK,_set_id,green都可以,¥,~abc,
阅读全文
posted @ 2023-06-19 14:57 fanghui778
阅读(43)
评论(0)
推荐(0)
2022年8月23日
记一次使用“msck repair table 表名”这个命令
摘要: 背景: 数据导入到hive后,查询不到数据 原因: MSCK REPAIR TABLE命令主要是用来解决通过hdfs dfs -put或者hdfs api写入hive分区表的数据在hive中无法被查询到的问题。 我们知道hive有个服务叫metastore,这个服务主要是存储一些元数据信息,比如数据
阅读全文
posted @ 2022-08-23 14:53 fanghui778
阅读(247)
评论(0)
推荐(0)
记ODS层数据删除的总结
摘要: 背景: 在进行大数据测试的时候,需要删除测试数据,我对ODS层数据也用truncate table 表名进行删除,然后报错,后面知道ODS层数据删除不能这样删 原因: ODS层数据一般是外部表,不是单单删除数据那么简单,它还有数据文件在HDFS上 正确方法: 1.进入容器,切换为能进入HDFS的用户
阅读全文
posted @ 2022-08-23 14:45 fanghui778
阅读(138)
评论(1)
推荐(0)
2022年8月11日
Hive实战——标签表造数据之case when then
摘要: 背景: 测试环境需要往标签表里面灌入标签数据, 需求: 短期流失,中期流失,唤醒 ,沉睡 随机20%用户 然后6月30号 5月31号 各补一次 代码: 随机20%用户 select * from wolf_7uxfyecbufj1xuqp.tb_user tablesample(20 percent
阅读全文
posted @ 2022-08-11 17:39 fanghui778
阅读(204)
评论(0)
推荐(0)
Hive实战——炸裂函数lateral view explode() (转载)
摘要: Hive Lateral View + explode 详解 (29条消息) Hive Lateral View + explode 详解_YaoYong_BigData的博客-CSDN博客_hive lateral view原理 Hive之explode()函数和posexplode()函数和la
阅读全文
posted @ 2022-08-11 14:00 fanghui778
阅读(691)
评论(0)
推荐(0)
Hive实战——修改一条数据
摘要: 背景: 测试环境经常需要修改大数据里面的一条数据用来满足测试,比如修改一条数据的手机号用来发短信 思路: 1. insert overwrite table table1 select id,修改后的内容 as cols from table1 where id = 你修改行的id 先弄出你要修改的
阅读全文
posted @ 2022-08-11 11:01 fanghui778
阅读(5303)
评论(0)
推荐(0)
2022年1月11日
mysql-join总结
摘要: join表我理解的就是两个表或者多个表因为有关联字段(或者叫外键)进行关联关系的筛选 一、join 同inner join 筛选出来两个表或多个表的关联字段值相等的数据,只要左边表的关联字段与右表匹配上,就会出现一条数据,所有会出现左边字段多条的情况,比如筛选出来有订单的用户, 二、left joi
阅读全文
posted @ 2022-01-11 17:06 fanghui778
阅读(96)
评论(0)
推荐(0)
2021年12月30日
mysql报错:Invalid use of group function
摘要: select orderNumber, sum(priceEach * quantityOrdered) as totalvalues from orderdetails where sum(priceEach * quantityOrdered) > 60000; 报错原因: 是由于在where语
阅读全文
posted @ 2021-12-30 15:25 fanghui778
阅读(2299)
评论(0)
推荐(0)
2021年12月14日
hive实战一:分区表里面增加数据
摘要: 步骤: 一.xshell上连上hive 的客户端: 1.xshell连接上服务器,需要知道主机的地址、端口号、用户名、密码 2.连接hive客户端:sh client_0.sh 3.输入hive 连接hive或者spark_beeline 二、分区插入两条数据 insert into 表名 part
阅读全文
posted @ 2021-12-14 13:36 fanghui778
阅读(2288)
评论(0)
推荐(0)
2020年9月30日
Fiddler实践五:弱网测试
摘要: 前言 模拟网速 一 1)打开模拟调节速度 2)Rules Customize Rules点击打开 3)弹出来了Fiddler Script页面,找到以下代码进行修改 if (m_SimulateModem) { // Delay sends by 300ms per KB uploaded. oSe
阅读全文
posted @ 2020-09-30 17:52 fanghui778
阅读(197)
评论(0)
推荐(0)
下一页
公告