随笔分类 - 爬虫

爬虫----爬取搜狐新闻时政类

摘要：一、整体流程爬取页面:https://www.sohu.com/c/8/1460?spm=smpc.news-home.top-subnav.2.1627024626549cMWiORW 获取url——爬取出版社及新闻名称及其超链接——解析数据——存储数据二、分析观察页面发现,搜狐新闻页面属阅读全文

posted @ 2021-07-23 19:09 二笙阅读(899) 评论(0) 推荐(0)

爬取百度产品列表

摘要：import requests from bs4 import BeautifulSoup url = 'https://www.baidu.com/more/' response = requests.get(url) response.encoding = 'utf-8' # 解析html so 阅读全文

posted @ 2021-06-13 10:35 二笙阅读(204) 评论(0) 推荐(0)

二笙

随笔分类 - 爬虫

公告