随笔分类 - 爬虫
摘要:一 、整体流程 爬取页面:https://www.sohu.com/c/8/1460?spm=smpc.news-home.top-subnav.2.1627024626549cMWiORW 获取url——爬取出版社及新闻名称及其超链接——解析数据——存储数据 二、分析 观察页面发现,搜狐新闻页面属
阅读全文
摘要:import requests from bs4 import BeautifulSoup url = 'https://www.baidu.com/more/' response = requests.get(url) response.encoding = 'utf-8' # 解析html so
阅读全文

浙公网安备 33010602011771号