一个通过Cookie登录并爬取数据的例子

import requests
from bs4 import BeautifulSoup
import time
import random

url = 'https://book.douban.com/mine?status=collect'

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
    "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
    "Referer": "https://www.douban.com/",
    "Cookie": """your_cockies""",
}

with requests.Session() as s:
    s.headers.update(headers)
    time.sleep(random.uniform(1,3))
    response = s.get(url)
    response.raise_for_status()
    soup = BeautifulSoup(response.content, 'html.parser')
    print(soup.prettify())

posted @ 2025-02-21 17:21 南乡水阅读(15) 评论(0) 收藏举报

刷新页面返回顶部

南乡水

一个通过Cookie登录并爬取数据的例子

公告