随笔分类 -  Reptilian

摘要:在Http请求中,很多时候我们要设置Cookie和获取返回的Cookie,在这个问题上踩了一个很大的坑,主要是两个问题: 1.不能获取到重定向返回的Cookie; 2.两次请求返回的Cookie是相同的; (接口是苏宁登录的接口,是用ids_r_me兑换authId的,这是单点登录常见的方式)后来我 阅读全文
posted @ 2018-11-28 19:18 Ben_Mario 阅读(6422) 评论(0) 推荐(0)
摘要:先来吐槽一下,突然接到一个任务,要我收集所有的联行行号,由于网络的原因,我开始访问页面都很慢,我就想着去网上找找现成的,结果CSDN上果然有好多人上传的,但是由于很早以前CSDN升级以后,账号全都要解封,我这个人记性不好,密码什么的都忘记了,连账号都模糊了,所以就让朋友帮忙下载,结果需要C币,我朋友 阅读全文
posted @ 2018-09-12 14:03 Ben_Mario 阅读(1369) 评论(1) 推荐(2)
摘要:爬虫的主要目的是在Web爬取数据,Web上获取数据基本是两种思路:理论上浏览器能得到的数据,爬虫都能得到 1.寻找数据接口 2.获取整个Html页面 爬取的对象分有权限管理和无权限管理,这两种都做过区别很大。 无权限管理的从形式上来说是很简单的,主要是深度和广度的设计,无论是寻找的数据接口还是整个H 阅读全文
posted @ 2018-03-29 16:17 Ben_Mario 阅读(195) 评论(0) 推荐(1)