爬虫解析:python如何判断requests库请求返回的是json还是html还是其他? - 指南
更多内容请见: 《爬虫和逆向教程》 - 专栏介绍和目录
文章目录
一、检查 Content-Type 响应头(最推荐)
要判断 requests 库返回的内容类型,最可靠、最标准的方法是检查 HTTP 响应头中的 Content-Type字段。服务器会在响应头中明确告知客户端返回的数据是什么类型。
1.1 核心步骤
- 发送请求后,通过
response.headers获取响应头字典。 - 访问
response.headers.get('Content-Type', '')来获取Content-Type的值。使用.get()并提供默认值可以避免因该字段不存在而报错。 - 使用字符串的
in操作符来判断类型。
1.2 验证代码
import requests
# 示例URLs
json_url = 'https://api.github.com/ev
浙公网安备 33010602011771号