19.bs4 BeautifulSoup处理数据

 

#__author__:  zoe
#date: 2020/5/17
from bs4 import BeautifulSoup
import os
import re

file= open("./baidu.html",'rb')
html= file.read().decode("utf-8")
bs = BeautifulSoup(html,'html.parser')
# print(bs.title) #打印title
# print(bs.head.contents) # 打印head
#print(bs.head.contents[1]) #打印第一个mata
#fd= bs.find_all('a') ###find_all 字符串过滤
#fd = bs.find_all(re.compile('a'))
# def find_Name(tag):
# return tag.has_attr('name')
# fd = bs.find_all(text=re.compile('\d')) #用正则表达式来查找文本中包含特定文本的内容(标签里的字符串)
#fd = bs.find_all('a',limit=3) #限制显示3个

##CSS选择器
#fd = bs.select('title") #用标题查找
#fd = bs.select('.mnav') ##.mnav 显示出所有类名
#fd = bs.select('#u1') #用id'u1'来查找
# fd = bs.select("a[class='bri']") #通过属性来查找,a类别中的bri方法
# fd = bs.select("head > title") #通过子标签来查找
fd = bs.select('.mnav ~ .bri') #查找mnav的兄弟标签
print(fd[0].get_text()) #打印第一个结果的文本
#
# for i in fd:
# print(i)
#print(fd)
posted @ 2020-05-17 14:19  十名知花香  阅读(271)  评论(0编辑  收藏  举报