似不是傻 - 博客园

redis 安装，及基本命令

摘要： redis数据库安装及简单的增删改查 redis下载地址：https://github.com/MSOpenTech/redis/releases。解压之后，运行 redis-server.exe redis.windows.conf 。如下图：不要关闭redis-server.exe窗口，打开阅读全文

posted @ 2018-08-02 11:36 似不是傻阅读(789) 评论(0) 推荐(0)

Scrapy爬取大众养生网

摘要：（1）进入养生之道网首页，分析首页布局：首页布局分为五个大类，食疗养生，养生人群，运动养生，医学健康，糖尿病我们同过这几个大类，进入链接，爬取大类下的子分类，并把子分类链接和子分类名and五个大类名字，分别存入redis和mongodb库中，编写Health.py文件。（2）通过向rsdis库依阅读全文

posted @ 2017-12-17 17:47 似不是傻阅读(223) 评论(0) 推荐(0)

笔记——抓包工具抓取手机app内容

摘要： Fiddler爬取手机app安装设置: 编写wawayaya.py文件：代码说明：阅读全文

posted @ 2017-12-12 19:16 似不是傻阅读(356) 评论(0) 推荐(0)

爬取起点小说网（三）遇到的问题和代码解析

摘要：爬取起点小说网运用到的知识：（1）redis，mongdb，的连接，删查，mongdb更新等；（2）scrapy框架的基本格式， class qidianNovelSpider(scrapy.Spider): name = "qidianNovel" #执行文件名 allowed_domains 阅读全文

posted @ 2017-12-12 18:20 似不是傻阅读(720) 评论(0) 推荐(0)

爬取起点小说网（二）设计代码

摘要： 1.安装pip install Scrapy#一定要以管理员身份运行dos窗口conda install scrapy2.创建项目scrapy startproject novel 3.创建qidianClass4.py文件，爬取小说一级分类，二级分类，名称和链接，分别存入mongdb和redis库阅读全文

posted @ 2017-12-12 18:17 似不是傻阅读(520) 评论(1) 推荐(0)

爬取起点小说网（一）设计思想

摘要： Scrapy框架爬取起点小说网：（1）开始设计：运用的工具：redis,mongodb,pychorm,python3.6环境逻辑: 分析：先爬取起点小说网站的分类，和子分类；eg：玄幻是个大分类，下面还分有东方玄幻，异世大陆，王朝争霸，高武世界4个子分类《1》第一步：我们先爬取起点小说网的阅读全文

posted @ 2017-12-03 16:43 似不是傻阅读(489) 评论(0) 推荐(0)