欢迎来到村民的博客

你就是你要成为的那个人!

2023年1月11日

详解CSS3:overflow属性

摘要: 1.Overflow overflow为溢出(容器),当内容超出容器时只需添加overflow属性值为hidden, 就可以把超出容器的部分隐藏起来; 如果内容超出容器却又不想其隐藏时可以将其属性值设置为auto; overflow:auto 属性如果超出就出现滚动条,没有超出则不出现滚动条这样就可 阅读全文

posted @ 2023-01-11 21:04 中国村民 阅读(325) 评论(0) 推荐(0)

xpath爬取唐诗三百首

摘要: 首页如图 抓包工具显示如下 点击作者后,转到详情页 抓包工具显示如下、 爬取代码如下 1 时间:2023/1/9 22:10 2 功能描述 3 4 ''' 5 import requests 6 from lxml import etree 7 8 url = 'https://tangshi.50 阅读全文

posted @ 2023-01-11 18:58 中国村民 阅读(304) 评论(0) 推荐(0)

2023年1月10日

Python网络爬虫get方法出现乱码的解决的三种方案

摘要: 给大家祭出网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助。 方案一 将requests.get().text改为requests.get().content 我们可以看到通过text()方法获取到的源码,之后进行打印输出的话,确实是会存在乱码的。此时可以考虑将请求变为.content 阅读全文

posted @ 2023-01-10 09:15 中国村民 阅读(743) 评论(0) 推荐(0)

2023年1月9日

xpath解析数据的方法

摘要: 1 功能描述 2 1.实例化一个etree对象,且需要将被解析的页面源码数据加载到该对象中 3 2.调用etree对象中的XPath表达式实现标签的定位和内容捕获 4 3.环境安装 pip install lxml 5 实例化一个etree对象方法有 6 1.将本地的html文档的源码数据加载到et 阅读全文

posted @ 2023-01-09 21:58 中国村民 阅读(76) 评论(0) 推荐(0)

2023年1月8日

BeautifulSoup解析数据的属性与方法

摘要: 1 功能描述 2 pip install bs4 3 pip install lxml 4 5 1.实例化一个BeautifulSoup对象,并且将页面源代码数据加载到该对象中 6 可以将本地的html文档中的数据加载到该对象中 7 fp= open('test.html','r',encoding 阅读全文

posted @ 2023-01-08 09:44 中国村民 阅读(206) 评论(0) 推荐(0)

利用BeautifulSoup爬取三国演义

摘要: 1 import requests 2 from bs4 import BeautifulSoup 3 headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like 阅读全文

posted @ 2023-01-08 09:41 中国村民 阅读(77) 评论(0) 推荐(0)

2023年1月7日

python网络爬虫数据解析之正则

摘要: 本节内容,讲解爬取网络图片,利用正则匹配图片地址 请求网页之后,响应部分内容如下图: 1 时间:2023/1/7 10:42 2 功能描述 3 1.进行指定标签的定位 4 2.标签或者标签对应的属性中存储的数据值进行提取(解析) 5 获取图片地址并下载 6 7 8 编码流程 9 1.指定url 10 阅读全文

posted @ 2023-01-07 19:55 中国村民 阅读(88) 评论(0) 推荐(0)

2023年1月2日

用python爬取网络文章----滴天髓

摘要: 用python爬取网络文章真的很简单。主要分以下几个步骤 1、安装并导入相关模块. 这里我们要用到两个模块,分别是reqesets和lxml 安装命令pip install requests和pip install lxml 1 import requests 2 from lxml import 阅读全文

posted @ 2023-01-02 20:50 中国村民 阅读(194) 评论(0) 推荐(0)

导航