BeautifulSoup

官网:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

菜鸟教程:http://www.jsphp.net/python/show-24-214-1.html

自己写的日记:https://i-beta.cnblogs.com/diaries/edit;postId=11769165

1、解析(第一步)

from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')

2、find

ret = find(name="标签", attrs={})
find_all(name="标签", attrs={})
find_all(text="Foo")

 注意:find取第一个,find_all 取所有

3、判断是否具有该属性

# 该标签有这个属性的,返回True,否则返回False
soup.a.has_attr("href")

4、获取所有text内容

soup.get_text()

 5、通过CSS获取内容(一般不用)

ret = soup.select(".c1 #d1")

 

posted @ 2019-11-13 09:31  市丸银  阅读(144)  评论(0编辑  收藏  举报