python爬虫—学习笔记-5

python爬虫—学习笔记-5

ps:已过半学期了 ,继续加油!!

课前准备

下载模块:

准备本次使用模块bs4以及openpyxl:

image-20240507172052096

正式内容

因为前期内容用到的都是前几次课的内容 不做过多讲解了:

获取网页数据以及清洗得到的数据

image-20240507172139918

image-20240507172324886

#数据清洗:
strip()  #去除前后的空格
split() #分割字符串
"".jion()  #拼接

创建Excel文件

image-20240507172626812

image-20240507172749113

最后结果

image-20240507172806380

读取Excel文件 并写入html网站

image-20240507173039154

image-20240507173051187

image-20240507173100088

image-20240507173128425

image-20240507173134377

最后结果

image-20240507173138251

image-20240507173152088****

posted @ 2024-05-07 17:34  wind风语  阅读(4)  评论(0编辑  收藏  举报