摘要: 由于京东的滑块验证码只提供缺口图片,所以我通过不断刷新验证码发现其图片库总共只有10张,然后我提前将不同的缺口图片进行合成已获得完整的参照图片并保存在指定的文件夹中以备用。之后的具体步骤为: 首先用selenium打开京东登录页面并点击账号密码登录方式,自动填充帐号密码点击登录出现验证码,获取验证码 阅读全文
posted @ 2020-06-06 14:05 fruhling 阅读(3326) 评论(0) 推荐(0)
摘要: 目标:输入电影名称,显示其基本信息,并生成一张评论词云图 电影信息来源为豆瓣网,搜索页面地址为https://search.douban.com/movie/subject_search?由于其页面是通过js渲染的,直接通过requests请求是拿不到电影查询结果的,所以我先用selenium获取本 阅读全文
posted @ 2020-06-06 11:52 fruhling 阅读(1169) 评论(0) 推荐(0)
摘要: 下载目标是堆糖网热门图片,打开网页并下拉发现图片是通过ajax加载的,按F12打开开发者工具选择nerwork并筛选xhr,继续下拉网页找到ajax请求的api,如下图所示 然后就可以构造请求获取包含图片url的json数据,对于网络请求等IO密集型任务,开启进程池可以提高下载速度 代码如下: im 阅读全文
posted @ 2020-06-04 20:19 fruhling 阅读(448) 评论(0) 推荐(0)
摘要: 思路比较简单,先用selenium模拟登陆B站获取cookie,然后用requests请求获取个人关注列表 这里主要难点是滑块验证码的轨迹生成,还要注意的一个点就个人中心是异步加载的,直接访问地址没有内容,通过分析找到被关注用户数据来源地址为url = 'https://api.bilibili.c 阅读全文
posted @ 2020-05-31 17:55 fruhling 阅读(1700) 评论(0) 推荐(0)
摘要: 有道翻译主页http://fanyi.youdao.com/ 打开开发者工具,选择newwork中的xhr,然后输入要翻译的文字,点击请求记录会发现post请求地址如图所示 查看请求参数并多输入几组翻译对象,会发现其中参数的一些信息,i是要翻译的对象,from-to为翻译语言选择,其余的每次都会变的 阅读全文
posted @ 2020-05-29 14:18 fruhling 阅读(319) 评论(0) 推荐(0)