摘要: 工具:python3 解释:Ajax 是一种用于创建快速动态网页的技术,在无需重新加载整个网页的情况下,能够更新部分网页的技术。 目标:爬取使用Ajex结束的豆瓣网页 执行上述代码后,将得到的内容在json.cn中转码,出现如下错误: 说明文件格式不对,没能正确转码,尝试将返回值response进行 阅读全文
posted @ 2018-05-28 21:17 高圈圈 阅读(691) 评论(0) 推荐(1)
摘要: 工具:python3 过程:抓包得到有道翻页面的url;复制post请求头,得到headers中的信息;复制post请求的body,得到formdata中的信息。构造post请求,返回响应 返回error:50 修改url,去掉_o后仍然不能得到正确的信息,,,原来,有道有反爬虫机制! 哈哈哈哈,刚 阅读全文
posted @ 2018-05-28 20:50 高圈圈 阅读(343) 评论(0) 推荐(1)