八爪鱼抓“鱼”基础

八爪鱼抓“鱼”基础

1.需求分析

爬取网页中的电影名称,更新时间以及简介

https://www.bjoku.com/ystop/dydq/year/2021.html

2.实验设计

2.1注册八爪鱼账号,下载安装工具

https://www.bazhuayu.com/

2.2抓取数据

  1. 打开网页,点击开始采集;
    image

  2. 点击“下一页”,选择“循环点击下一页”
    image

  3. 选中电影名称,再次点击第二个电影的名称,软件会自动选择同类型的数据,显示在下方(红色的方框内);再点击“循环点击每个链接”
    image

  4. 左键点击电影名称,采集该元素的文本,在下方的数据窗口,修改字段名称;依次对'更新时间'和'简介字段'操作。
    image

  5. 点击保存,开始采集(本地采集)
    image

  6. 开始采集数据--停止采集--导出数据
    image

  7. 检查数据文件
    image

posted @ 2021-12-16 13:43  不会写代码的花生  阅读(216)  评论(0)    收藏  举报