2017 年 4月 14 日随笔档案 - 玄魂

2017年4月14日

摘要：因为本人一直对推理悬疑比较感兴趣，所以这次爬取的网站也是平时看一些悬疑故事的网站，同时也是因为这个网站在编码上面和一些大网站的博客不同，并不那么规范，所以对于初学者还是有一定的挑战性的。我打算把这个爬虫分三次讲，所以每次都先完成一个小目标（当然不是一个亿啦），这次课我们先爬取当前页面的并且下载第一篇文章。第二次课我们就将爬取当前页面的=所有的链接进行下载，第三次课我们将把整个板块的文章都下载下来。演示系统用的是kali，因为懒得去配置各种py模块了，就利用系统已经配置好的，浏览器是firefox，使用的IDE是微软的vscode 阅读全文

posted @ 2017-04-14 13:25 玄魂阅读(691) 评论(0) 推荐(0) 编辑

玄魂工作室

探讨实践与真理的距离

公告