wukazi - 博客园

2024年2月

摘要： python爬虫主要思路： 1.选取目标网页：获得链接，观察源代码构成。 2.用request库的get方法取得源代码。其中header参数用于伪装正常浏览器发送请求，proxies用于设置访问代理，url为目标网站 3.获取text后用BS对象查找相应内容标签，要注意利用id，class名的特殊性阅读全文

posted @ 2024-02-18 09:35 wukazi 阅读(2124) 评论(0) 推荐(0)

公告