摘要: 爬取城市列表# -*- coding:utf-8 -*-import requestsfrom lxml import etreeimport osif __name__ == "__main__": # ... 阅读全文
posted @ 2020-08-14 13:07 消磨_时间 阅读(123) 评论(0) 推荐(0) 编辑
摘要: requests模块: - 安装 pip install requests - 定义url url = 'https://www.sougou.com/' - UA伪... 阅读全文
posted @ 2020-08-14 12:35 消磨_时间 阅读(61) 评论(0) 推荐(0) 编辑
摘要: xpath解析: -最常用且最高效便捷的一种解析方式,通用性强. - xpath解析原理 - 1. 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中 ... 阅读全文
posted @ 2020-08-14 12:22 消磨_时间 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 抓取三国演义小说# -*- coding:utf-8 -*-import requestsfrom bs4 import BeautifulSoupimport lxmlif __name__ == "__mai... 阅读全文
posted @ 2020-08-14 10:32 消磨_时间 阅读(140) 评论(0) 推荐(0) 编辑