• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
隐身
不能改变社会,就要学会改变自己
博客园    首页    新随笔    联系   管理    订阅  订阅

爬取豆瓣top250

爬取豆瓣top250 电影名称  评分和评价人数

import requests
from bs4 import BeautifulSoup
def func(ur):
    resp = requests.get(url,headers={
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"
    })
    main_page = BeautifulSoup(resp.text, "html.parser")
    ol = main_page.find("ol", attrs={"class": "grid_view"})
    lst = ol.find_all("li")
    for li in lst:
        name = li.find("div",attrs={"class":"hd"}).find("span",attrs={"class":"title"}).text
        score = li.find("span", attrs={"class": "rating_num"}).text
        evaluate = li.find("div",attrs={"class":"star"}).find_all("span")[-1].text
        print(name,score,evaluate)

for i in range(10):
    url = f"https://movie.douban.com/top250?start={i*25}&filter="
    func(url)

运行后打印截图:

 

 

 

posted @ 2019-12-27 17:00  隐身哈  阅读(118)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3