随笔分类 -  爬虫

摘要:目录 1. 对文本内容的爬取 2.对二进制资源的爬取【图片、音频等】 1. 对文本内容的爬取 今天,我们对 https://ssr1.scrape.center/ 该网站进行爬取 目标:爬取第一页的电影名称(10个电影) import requests import re response = re 阅读全文
posted @ 2023-03-18 17:36 辰梦starDream 阅读(67) 评论(0) 推荐(0)
摘要:URL 一般格式规范 协议://[username:password@]主机名[:端口号][/路径][;parameters][?query][#fragment] 举个例子:https://www.baidu.com/ 我们可以看到只有 协议 和 主机名 两部分。 协议:一般常用的有 http h 阅读全文
posted @ 2023-03-18 16:12 辰梦starDream 阅读(13) 评论(0) 推荐(0)