中国村民 - 博客园

详解CSS3:overflow属性

摘要： 1.Overflow overflow为溢出（容器），当内容超出容器时只需添加overflow属性值为hidden，就可以把超出容器的部分隐藏起来；如果内容超出容器却又不想其隐藏时可以将其属性值设置为auto； overflow：auto 属性如果超出就出现滚动条，没有超出则不出现滚动条这样就可阅读全文

posted @ 2023-01-11 21:04 中国村民阅读(325) 评论(0) 推荐(0)

xpath爬取唐诗三百首

摘要：首页如图抓包工具显示如下点击作者后，转到详情页抓包工具显示如下、爬取代码如下 1 时间：2023/1/9 22:10 2 功能描述 3 4 ''' 5 import requests 6 from lxml import etree 7 8 url = 'https://tangshi.50 阅读全文

posted @ 2023-01-11 18:58 中国村民阅读(305) 评论(0) 推荐(0)

Python网络爬虫get方法出现乱码的解决的三种方案

摘要：给大家祭出网络爬虫过程中三种中文乱码的处理方案，希望对大家的学习有所帮助。方案一将requests.get().text改为requests.get().content 我们可以看到通过text()方法获取到的源码，之后进行打印输出的话，确实是会存在乱码的。此时可以考虑将请求变为.content 阅读全文

posted @ 2023-01-10 09:15 中国村民阅读(744) 评论(0) 推荐(0)

xpath解析数据的方法

摘要： 1 功能描述 2 1.实例化一个etree对象，且需要将被解析的页面源码数据加载到该对象中 3 2.调用etree对象中的XPath表达式实现标签的定位和内容捕获 4 3.环境安装 pip install lxml 5 实例化一个etree对象方法有 6 1.将本地的html文档的源码数据加载到et 阅读全文

posted @ 2023-01-09 21:58 中国村民阅读(77) 评论(0) 推荐(0)

BeautifulSoup解析数据的属性与方法

摘要： 1 功能描述 2 pip install bs4 3 pip install lxml 4 5 1.实例化一个BeautifulSoup对象，并且将页面源代码数据加载到该对象中 6 可以将本地的html文档中的数据加载到该对象中 7 fp= open('test.html','r',encoding 阅读全文

posted @ 2023-01-08 09:44 中国村民阅读(206) 评论(0) 推荐(0)

利用BeautifulSoup爬取三国演义

摘要： 1 import requests 2 from bs4 import BeautifulSoup 3 headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like 阅读全文

posted @ 2023-01-08 09:41 中国村民阅读(80) 评论(0) 推荐(0)

python网络爬虫数据解析之正则

摘要：本节内容，讲解爬取网络图片，利用正则匹配图片地址请求网页之后，响应部分内容如下图： 1 时间：2023/1/7 10:42 2 功能描述 3 1.进行指定标签的定位 4 2.标签或者标签对应的属性中存储的数据值进行提取（解析） 5 获取图片地址并下载 6 7 8 编码流程 9 1.指定url 10 阅读全文

posted @ 2023-01-07 19:55 中国村民阅读(89) 评论(0) 推荐(0)

用python爬取网络文章----滴天髓

摘要：用python爬取网络文章真的很简单。主要分以下几个步骤 1、安装并导入相关模块. 这里我们要用到两个模块，分别是reqesets和lxml 安装命令pip install requests和pip install lxml 1 import requests 2 from lxml import 阅读全文

posted @ 2023-01-02 20:50 中国村民阅读(194) 评论(0) 推荐(0)