文章分类 - 大数据
摘要:先准备需要导入的csv文件 将需要导入的csv文件上传到服务器上,保存在一个目录下。 查看hive的路径 查看跟路径下的文件 hdfs dfs -ls / 查看某一个特定的路径下的文件 hdfs dfs -ls hdfs://worker01:81120/ 若没有自己的文件夹,可以新建一个文件夹 h
阅读全文
摘要:在a表中有id和date两列,记录用户当天是否签到,想查询出哪些用户连续签到了3天(或连续签到更多天,是连续签到) (1) 先开窗,排个序: select user_id, login_time, row_number() over(partition by user_id order by log
阅读全文
摘要:Hive入门 Hive简介 Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张表,并提供类SQL查询功能。 (1)在Hadoop用mapreduce程序实现,当时需要写Mapper、Reduce和Driver三个类,并实现对应的逻辑,相对繁琐。 (2
阅读全文

浙公网安备 33010602011771号