偶然路过的靓仔-胡阳

为中华之崛起而读书!中国加油! 问题不能及时回答,有需要的话加微信:921308494

   ::  ::  ::  ::  :: 管理

安装beautifulsoup

pip install beautifulsoup4

 

 

简单代码示例:

import requests  #导入requests包
from bs4 import BeautifulSoup #导入beautifulsoup 包


def getit():
r=requests.get('https://www.baidu.com/')

page=r.content #获取页面全部

Bsoup=BeautifulSoup(page,"html.parser") #解析成一行行树形代码

print(Bsoup.prettify()) #解析成带缩进 可读的一行行树形代码

result=Bsoup.find_all('a',class_="mnav") #检索 a标签 class为mnav
  
  #result为list类型,可以for循环遍历读取数据,也可以用re读取数据
for i in result:
print(i,'取值:',i['href'],i['name'],i.string)

def sava_data():
#保存在txt
#保存在excel
#保存到数据库
pass

if __name__ == '__main__':
getit()
  ...

运行结果:

 


 



posted on 2023-01-31 14:52  偶然路过的靓仔-胡阳  阅读(32)  评论(0编辑  收藏  举报