摘要: 1.今日完成任务 处理工资字段不合规数据, 使该字段数据格式统一 2.核心源码 3.遇到的问题 解决办法 5.项目燃尽图更新(此内容周一已更新) 阅读全文
posted @ 2020-07-22 17:23 神鲧 阅读(118) 评论(0) 推荐(0)
摘要: 1.今日完成任务 数据清洗准备 对于原始数据集字段缺失采用填充默认值 2.核心源码 3.遇到的问题 运行mr任务时未能识别IP 解决办法 把IP替换为主机名 5.项目燃尽图更新(此内容周一已更新) 阅读全文
posted @ 2020-07-21 17:35 神鲧 阅读(113) 评论(0) 推荐(0)
摘要: 1.今日完成任务 Sqoop 安装 Flume安装 2.核心源码 3.遇到的问题 爬虫二级页面读取 4.解决办法 5.项目燃尽图更新 阅读全文
posted @ 2020-07-20 17:38 神鲧 阅读(119) 评论(0) 推荐(0)
摘要: 1.今日完成任务 使用爬虫爬取招聘网站信息 2.核心源码 3.遇到的问题 目前只能爬取一级页面信息,类似职位描述等在详情页,暂时无法爬取 4.解决办法 5.项目燃尽图更新(此内容周一已更新) 阅读全文
posted @ 2020-07-17 15:38 神鲧 阅读(177) 评论(0) 推荐(0)
摘要: 1.今日完成任务 简单了解python基础语法 简单了解爬虫基础 安装爬虫所需要的库,插件 2.核心源码 3.遇到的问题 4.解决办法 5.项目燃尽图更新(此内容周一已更新) 阅读全文
posted @ 2020-07-17 15:18 神鲧 阅读(114) 评论(0) 推荐(0)
摘要: 1.今日完成任务 Hadoop 全分布部署 Hive 组件部署 Hbase 组件部署 Zookeeper 集群部署 python安装 pycharm安装 2.核心源码 3.遇到的问题 4.解决办法 5.项目燃尽图更新(此内容周一已更新) 阅读全文
posted @ 2020-07-17 15:02 神鲧 阅读(100) 评论(0) 推荐(0)
摘要: 需求分析 1. 引言 1.1. 背景 随着大数据革命的到来,引起数据分析人才的需求激增,而市场上的人才供给出现脱节现象。为更好地了解市场需求,选取拉勾网、智联招聘、前程无忧等招聘网站为数据源,利用数据挖掘技术从能力要求、福利待遇、工作经验、薪资水平及企业地点分布等方面进行分析,研究结果可为高校人才培 阅读全文
posted @ 2020-07-14 17:21 神鲧 阅读(818) 评论(0) 推荐(0)