2021 年 12月 19 日随笔档案 - 宇一心途

2021年12月19日

摘要：爬取的目标对象：豆瓣图书标签: 历史 (douban.com) 关于豆瓣历史书籍爬取该标签下的书籍信息，这里不做保存处理，只打印显示信息。一、先分析分析 1、链接首先它是分成许多页的，第一页的链接：https://book.douban.com/tag/%E5%8E%86%E5%8F%B2 阅读全文

posted @ 2021-12-19 23:23 宇一心途阅读(107) 评论(0) 推荐(0)

python爬虫学习基础之网页解析(1)re正则

摘要：网页解析：从网页中提取出所需的信息（例如新的url，数据等等）网页解析常用的方法有：re(正则表达式)，BeautifulSoup，lxml，parsel，requests-html 这一篇只讲re，以后每一会发一篇文章，敬请期待吧官方文档：re 正则表达式操作 — Python 3.9.9 文阅读全文

posted @ 2021-12-19 18:22 宇一心途阅读(803) 评论(0) 推荐(0)

宇一心途

公告