2018 年 9月 3 日随笔档案 - vlj

2018年9月3日

摘要： #四个步骤 1.查看crawl内容的源码格式 crawl的内容可以是 url(链接），文字，图片，视频 2.请求网页源码（可能要设置）代理，限速，cookie 3.匹配用正则表达式匹配 4.保存数据文件操作 #两个基本工具（库） 1.urllib 2.requests #使用reuests库的阅读全文

posted @ 2018-09-03 19:37 vlj 阅读(649) 评论(0) 推荐(0)

vlj

公告