摘要:
爬取的目标对象:豆瓣图书标签: 历史 (douban.com) 关于豆瓣历史书籍 爬取该标签下的书籍信息,这里不做保存处理,只打印显示信息。 一、先分析分析 1、链接 首先它是分成许多页的, 第一页的链接:https://book.douban.com/tag/%E5%8E%86%E5%8F%B2 阅读全文
posted @ 2021-12-19 23:23
宇一心途
阅读(101)
评论(0)
推荐(0)
摘要:
网页解析:从网页中提取出所需的信息(例如新的url,数据等等) 网页解析常用的方法有:re(正则表达式),BeautifulSoup,lxml,parsel,requests-html 这一篇只讲re,以后每一会发一篇文章,敬请期待吧 官方文档:re 正则表达式操作 — Python 3.9.9 文 阅读全文
posted @ 2021-12-19 18:22
宇一心途
阅读(786)
评论(0)
推荐(0)

浙公网安备 33010602011771号