12 2017 档案
摘要:<!-- flowchart 箭头图标 勿删 --> 这篇文章将讲解如何爬取知乎上面的问答数据。 首先,我们需要知道,想要爬取知乎上面的数据,第一步肯定是登录,所以我们先介绍一下模拟登录: 先说一下我的思路: 1.首先我们需要控制登录的入口,重写start_requests方法。来控制到这个入口之后
阅读全文
摘要:mysql表的结构 数据(数据是通过爬虫得来的,本篇文章不介绍怎么爬取数据,只介绍将数据库中的数据可视化): 下面就是写代码了: 首先看一下项目目录: 数据库层 业务逻辑层 package dao; import java.sql.ResultSet;import java.sql.SQLExcep
阅读全文
摘要:本篇文章将从搭建虚拟环境开始,爬取伯乐在线上的所有文章的数据。 搭建虚拟环境之前需要配置环境变量,该环境变量的变量值为虚拟环境的存放目录 1. 配置环境变量 2.创建虚拟环境 用mkvirtualenv命令进行创建,--python后面加上python的安装目录,可以选择不同版本的python.这也
阅读全文

浙公网安备 33010602011771号