Python 网络爬虫

必考点

1.导入库

2.定义变量

url=''  '' link=''  ''  headers={user-agent:}

3.执行代码

r=requests.get('''地址'''，headers=headers，timeout=10）

response.html

4.判断

r.encoding    #编码问题（从http headers中猜测的内容编码)

r.status_code    #返回状态码 200

5.打印代码

print(r.text)

核心代码

#书写标准
try：
expect：    #抛出异常

r.encoding=r.apparent_encoding('''从内容中分析出来的内容编码''')
#在异常检测中，使用自动判断状态码：
r.raise_for_status()　　200

r.request.headers 　　#检查头标信息
r.request.url         #检查链接地址
''''

　　#带参数的url地址
    world={'wd':关键字'}
    url='https://www.baidu.com/s'

    ''''''

posted @ 2023-03-11 15:43 HelloMrTree 阅读(17) 评论(0) 收藏举报

刷新页面返回顶部