python爬取百度今日热点事件排行榜

1 导入相应的库

2 爬取网站url：

http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b1

3 找到爬取的内容

4 具体的代码实现

import requests
from bs4 import BeautifulSoup

url = 'http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b1'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64)'
                  'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
urls = requests.get(url, headers=headers)
urls.encoding = urls.apparent_encoding
text = urls.text
soup = BeautifulSoup(text, 'lxml')

c = soup.find_all(class_="list-title")
he = [i.get_text() for i in c]
q = soup.find_all('td', class_="last")
qq = [i.get_text().strip() for i in q]
print('{:25}\t{}'.format('标题', '搜索指数'))

for i,y in zip(he,qq):
   print('{:20}\t{}\n'.format(i,y))

5 test

posted on 2020-03-18 23:18 .Stewart 阅读(685) 评论(0) 收藏举报

刷新页面返回顶部

python爬取百度今日热点事件排行榜

公告