会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
神鲧
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
2020年7月22日
7-22
摘要: 1.今日完成任务 处理工资字段不合规数据, 使该字段数据格式统一 2.核心源码 3.遇到的问题 解决办法 5.项目燃尽图更新(此内容周一已更新)
阅读全文
posted @ 2020-07-22 17:23 神鲧
阅读(118)
评论(0)
推荐(0)
2020年7月21日
7-21
摘要: 1.今日完成任务 数据清洗准备 对于原始数据集字段缺失采用填充默认值 2.核心源码 3.遇到的问题 运行mr任务时未能识别IP 解决办法 把IP替换为主机名 5.项目燃尽图更新(此内容周一已更新)
阅读全文
posted @ 2020-07-21 17:35 神鲧
阅读(113)
评论(0)
推荐(0)
2020年7月20日
7-20
摘要: 1.今日完成任务 Sqoop 安装 Flume安装 2.核心源码 3.遇到的问题 爬虫二级页面读取 4.解决办法 5.项目燃尽图更新
阅读全文
posted @ 2020-07-20 17:38 神鲧
阅读(119)
评论(0)
推荐(0)
2020年7月17日
爬虫-51job
摘要: 1.今日完成任务 使用爬虫爬取招聘网站信息 2.核心源码 3.遇到的问题 目前只能爬取一级页面信息,类似职位描述等在详情页,暂时无法爬取 4.解决办法 5.项目燃尽图更新(此内容周一已更新)
阅读全文
posted @ 2020-07-17 15:38 神鲧
阅读(177)
评论(0)
推荐(0)
7-16
摘要: 1.今日完成任务 简单了解python基础语法 简单了解爬虫基础 安装爬虫所需要的库,插件 2.核心源码 3.遇到的问题 4.解决办法 5.项目燃尽图更新(此内容周一已更新)
阅读全文
posted @ 2020-07-17 15:18 神鲧
阅读(114)
评论(0)
推荐(0)
7-15
摘要: 1.今日完成任务 Hadoop 全分布部署 Hive 组件部署 Hbase 组件部署 Zookeeper 集群部署 python安装 pycharm安装 2.核心源码 3.遇到的问题 4.解决办法 5.项目燃尽图更新(此内容周一已更新)
阅读全文
posted @ 2020-07-17 15:02 神鲧
阅读(100)
评论(0)
推荐(0)
2020年7月14日
招聘项目需求分析
摘要: 需求分析 1. 引言 1.1. 背景 随着大数据革命的到来,引起数据分析人才的需求激增,而市场上的人才供给出现脱节现象。为更好地了解市场需求,选取拉勾网、智联招聘、前程无忧等招聘网站为数据源,利用数据挖掘技术从能力要求、福利待遇、工作经验、薪资水平及企业地点分布等方面进行分析,研究结果可为高校人才培
阅读全文
posted @ 2020-07-14 17:21 神鲧
阅读(818)
评论(0)
推荐(0)
上一页
1
2
公告