3. PowerBI--网络爬虫

本篇文字以爬取起点中文网人气小说的作品为例进行讲解，如果利用PowerBI进行网络爬虫。
要爬取的是该部分全部的小说信息

观察URL规律

首先由于该部分的数据分布在不同的页面中，通过点击不同的页面按钮来查看URL的变化

由此可以看出不同页面下URL只会变化page后面的数字。

爬取所有的页面数据，如下图所示

此处输入的内容，要结合页面中的数据进行

重复执行获取"页面数据"的前两步。
此时PowerBI，通过观察发现Table1表中的数据就是我们需要的目标数据

此步的主要目的就是根据之前观察的URL规律，将PowerBI原本解析网页的过程，转变为一个函数，通过传递不同的参数来获取不同的页面数据。

这样就完成了所有数据的爬虫工作。

posted @ 2024-07-13 19:26 Python习者阅读(30) 评论(0) 收藏举报

刷新页面返回顶部