第14.13节 BeautifulSoup的其他功能导览

前面《第14.9节 Python中使用urllib.request+BeautifulSoup获取url访问的基本信息
》、《第14.10节 Python中使用BeautifulSoup解析http报文：html标签相关属性的访问》和《第14.11节 Python中使用BeautifulSoup解析http报文：使用查找方法快速定位内容》三个章节详细介绍了使用BeautifulSoup解析html文档的功能，老猿对BeatifulSoap的介绍暂时到此为止，因为老猿也暂时只需要用这么多。但实际上BeatifulSoap的功能除了解析html文档的功能之外，还有非常强大的对html文档操作的其他功能，包括：
1、 HTML元素标签及标签内的字符串的修改；
2、在标签中添加内容；
3、增加新的标签；
4、增加新的字符串；
5、在指定位置插入标签；
6、删除指定标签；
7、替换指定内容；
8、在某个标签外面再包装一个块元素标签；
9、将某个标签内的html元素解包；
10、输出格式控制；
11、指定HTML文档编码类型或排除某些文档类型以加快文档解析过程；
12、将html文档指定输出编码类型来输出不同编码类型的html文档；
13、对某些指定的标签元素的字符串进行encode编码；
14、使用SoupStrainer指定解析html文档的指定部分以只解析需要的内容。

这些内容老猿暂时就不研究和介绍了，大家可以参考BeautifulSoup文档官网。

老猿Python，跟老猿学Python!
博客地址：https://blog.csdn.net/LaoYuanPython
老猿Python博客文章目录：https://blog.csdn.net/LaoYuanPython/article/details/98245036
请大家多多支持，点赞、评论和加关注！谢谢！

posted on 2019-09-13 16:49 老猿Python 阅读(159) 评论(0) 收藏举报

刷新页面返回顶部

老猿Python

第14.13节 BeautifulSoup的其他功能导览

导航

公告