python爬虫实战(八)--------知乎

相关代码已经修改调试成功----2017-4-22

一、说明

1.目标网址:知乎登入后的首页

2.实现:如图字段的爬取

zhihu_question表:

zhihu_answer表:

3.数据:存放在百度网盘,有需要的可以拿取 链接:http://pan.baidu.com/s/1qYQ6rk4 密码:ociz

zhihu_question表结果:

zhihu_answer表结果:

二、运行

运行我就不多说了,直接运行main.py就好了,相关的参数变一下就好了。有点基础的应该都会。

三、学习笔记

本项目爬取知乎的问题和回答的相关信息。本项目和伯乐在线项目差不多,新知识就是一个模拟登录。

四、问题----欢迎留言提出问题

1.暂时没有很大的问题解决不了,后期如果遇到再贴出来


如果本项目对你有用请给我一颗star,万分感谢。

想要看代码请移步我的github:https://github.com/pujinxiao/zhihu_spider

作者:今孝

出处:http://www.cnblogs.com/jinxiao-pu/p/6748042.html

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。

posted @ 2017-04-22 16:42  今孝  阅读(3298)  评论(1编辑  收藏  举报
//制作目录