05 2023 档案

摘要:(1)本周做了什么,花在学习上多长时间,花在代码上多长时间,花在解决问题用了多长时间。 本周主要学习了软件体系结构的相关课堂作业: 花在学习上16个小时,花在代码上10个小时,花在解决问题上6个小时。 (2)下周准备做什么? 下周开始继续学习和电子商务大数据分析 (3)本周遇到的问题? 一些程序和代 阅读全文
posted @ 2023-05-29 21:26 萧贾jzm 阅读(9) 评论(0) 推荐(0)
摘要:(1)本周做了什么,花在学习上多长时间,花在代码上多长时间,花在解决问题用了多长时间。 本周主要学习了软件体系结构的相关课堂作业: 花在学习上16个小时,花在代码上10个小时,花在解决问题上6个小时。 (2)下周准备做什么? 下周开始继续学习和电子商务大数据分析 (3)本周遇到的问题? 一些程序和代 阅读全文
posted @ 2023-05-24 17:56 萧贾jzm 阅读(11) 评论(0) 推荐(0)
摘要:import csvimport osimport timefrom lxml import etreefrom selenium import webdriver# 创建csvoutPath = 'C:\letter\letters_data.csv'if (os.path.exists(outP 阅读全文
posted @ 2023-05-18 09:58 萧贾jzm 阅读(21) 评论(0) 推荐(0)
摘要:六、构建百姓意见知识图谱 1、生成百姓意见关键词热词云图; 2、将百姓意见关键词与解决部门相关联,并将结果存储到图数据库中; 3、展示百姓意见与解决部门之间的关联。 阅读全文
posted @ 2023-05-15 08:30 萧贾jzm 阅读(19) 评论(0) 推荐(0)
摘要:五、开发JavaWeb+ECharts完成信件数据图表展示过程 大ECharts简介 ECharts,纯Javascript图表库,基于Canvas,底层依赖ZRender,商业产品常用图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性大大增强了 阅读全文
posted @ 2023-05-13 14:08 萧贾jzm 阅读(442) 评论(0) 推荐(0)
摘要:三、利用HiveSql语句离线分析信件内容数据 基础概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduc 阅读全文
posted @ 2023-05-11 11:54 萧贾jzm 阅读(93) 评论(0) 推荐(0)
摘要:四、利用Sqoop导出Hive分析数据到MySQL库 Sqoop概述 Sqoop是一款开源的工具,主要用于在Hadoop生态系统(Hadoop、Hive等)与传统的数据库(MySQL、Oracle等)间进行数据的传递,可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS的数 阅读全文
posted @ 2023-05-11 11:54 萧贾jzm 阅读(1678) 评论(0) 推荐(0)
摘要:二、编写MapReduce程序清洗信件内容数据 数据清洗概述 数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等 阅读全文
posted @ 2023-05-05 10:40 萧贾jzm 阅读(234) 评论(0) 推荐(0)

//歌单id