摘要: 一:先将服务都启动 二:将爬虫大作业获取的数据上传到HDFS中 三.把hdfs中的文本文件最终导入到数据仓库Hive中 启动hive 创建数据仓库maoyan 查看是否建立成功 用上传到HDFS中的数据,在数据库中建表,并且查看时否建立成功 四:在Hive中查看并分析数据 统计出观众所在城市数量最多 阅读全文
posted @ 2019-06-17 17:03 王子豪 阅读(241) 评论(0) 推荐(0)