BeautifulSoup

官网：https://www.crummy.com/software/BeautifulSoup/bs4/doc/

菜鸟教程：http://www.jsphp.net/python/show-24-214-1.html

自己写的日记：https://i-beta.cnblogs.com/diaries/edit;postId=11769165

1、解析(第一步)

from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')

2、find

ret = find(name="标签", attrs={})
find_all(name="标签", attrs={})
find_all(text="Foo")

注意：find取第一个，find_all 取所有

3、判断是否具有该属性

# 该标签有这个属性的，返回True，否则返回False
soup.a.has_attr("href")

4、获取所有text内容

soup.get_text()

5、通过CSS获取内容(一般不用)

ret = soup.select(".c1 #d1")

posted @ 2019-11-13 09:31 市丸银阅读(187) 评论(0) 收藏举报

刷新页面返回顶部

市丸银