随笔分类 - 爬虫
摘要:目录 1. 对文本内容的爬取 2.对二进制资源的爬取【图片、音频等】 1. 对文本内容的爬取 今天,我们对 https://ssr1.scrape.center/ 该网站进行爬取 目标:爬取第一页的电影名称(10个电影) import requests import re response = re
阅读全文
摘要:URL 一般格式规范 协议://[username:password@]主机名[:端口号][/路径][;parameters][?query][#fragment] 举个例子:https://www.baidu.com/ 我们可以看到只有 协议 和 主机名 两部分。 协议:一般常用的有 http h
阅读全文

浙公网安备 33010602011771号