道济书生

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年2月22日

摘要: 上学期在实验室发表时写了一个爬取智联招牌信息的爬虫。 操作流程大致分为:信息爬取——数据结构化——存入数据库——所需技能等分词统计——数据可视化 1.数据爬取 上面代码以上海、杭州、北京、广州、深圳的“通信工程师”为例实现爬取了智联招聘上每一则招聘信息的URL地址。 (示例)在智联招聘上如下图所示的 阅读全文
posted @ 2017-02-22 22:55 道济书生 阅读(4669) 评论(0) 推荐(0) 编辑