文章分类 -  大数据

摘要:先准备需要导入的csv文件 将需要导入的csv文件上传到服务器上,保存在一个目录下。 查看hive的路径 查看跟路径下的文件 hdfs dfs -ls / 查看某一个特定的路径下的文件 hdfs dfs -ls hdfs://worker01:81120/ 若没有自己的文件夹,可以新建一个文件夹 h 阅读全文
posted @ 2024-06-01 01:39 King-DA 阅读(76) 评论(0) 推荐(0)
摘要:在a表中有id和date两列,记录用户当天是否签到,想查询出哪些用户连续签到了3天(或连续签到更多天,是连续签到) (1) 先开窗,排个序: select user_id, login_time, row_number() over(partition by user_id order by log 阅读全文
posted @ 2024-05-24 19:19 King-DA 阅读(39) 评论(0) 推荐(0)
摘要:Hive入门 Hive简介 Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张表,并提供类SQL查询功能。 (1)在Hadoop用mapreduce程序实现,当时需要写Mapper、Reduce和Driver三个类,并实现对应的逻辑,相对繁琐。 (2 阅读全文
posted @ 2024-05-14 10:49 King-DA 阅读(9) 评论(0) 推荐(0)