摘要:
python爬虫主要思路: 1.选取目标网页:获得链接,观察源代码构成。 2.用request库的get方法取得源代码。其中header参数用于伪装正常浏览器发送请求,proxies用于设置访问代理,url为目标网站 3.获取text后用BS对象查找相应内容标签,要注意利用id,class名的特殊性 阅读全文
posted @ 2024-02-18 09:35
wukazi
阅读(2124)
评论(0)
推荐(0)
浙公网安备 33010602011771号