09 2018 档案
摘要:库:re;selenium;requests 源码: from selenium import webdriverimport reimport requests def open_img(items): for item in items: item = re.sub('&','&',it
阅读全文
摘要:#四个步骤 1.查看crawl内容的源码格式 crawl的内容可以是 url(链接),文字,图片,视频 2.请求网页源码 (可能要设置)代理,限速,cookie 3.匹配 用正则表达式匹配 4.保存数据 文件操作 #两个基本工具(库) 1.urllib 2.requests #使用reuests库的
阅读全文

浙公网安备 33010602011771号