2018年8月2日

redis 安装,及基本命令

摘要: redis数据库安装及简单的增删改查 redis下载地址:https://github.com/MSOpenTech/redis/releases。 解压之后,运行 redis-server.exe redis.windows.conf 。如下图: 不要关闭redis-server.exe窗口,打开 阅读全文

posted @ 2018-08-02 11:36 似不是傻 阅读(776) 评论(0) 推荐(0) 编辑

2017年12月17日

Scrapy爬取大众养生网

摘要: (1)进入养生之道网首页,分析首页布局: 首页布局分为五个大类,食疗养生,养生人群,运动养生,医学健康,糖尿病我们同过这几个大类,进入链接,爬取大类下的子分类,并把子分类链接和子分类名and五个大类名字,分别存入redis和mongodb库中,编写Health.py文件。 (2)通过向rsdis库依 阅读全文

posted @ 2017-12-17 17:47 似不是傻 阅读(203) 评论(0) 推荐(0) 编辑

2017年12月12日

笔记——抓包工具抓取手机app内容

摘要: Fiddler爬取手机app安装设置: 编写wawayaya.py文件: 代码说明: 阅读全文

posted @ 2017-12-12 19:16 似不是傻 阅读(315) 评论(0) 推荐(0) 编辑

爬取起点小说网(三)遇到的问题和代码解析

摘要: 爬取起点小说网运用到的知识: (1)redis,mongdb,的连接,删查,mongdb更新等; (2)scrapy框架的基本格式, class qidianNovelSpider(scrapy.Spider): name = "qidianNovel" #执行文件名 allowed_domains 阅读全文

posted @ 2017-12-12 18:20 似不是傻 阅读(616) 评论(0) 推荐(0) 编辑

爬取起点小说网(二)设计代码

摘要: 1.安装pip install Scrapy#一定要以管理员身份运行dos窗口conda install scrapy2.创建项目scrapy startproject novel 3.创建qidianClass4.py文件,爬取小说一级分类,二级分类,名称和链接,分别存入mongdb和redis库 阅读全文

posted @ 2017-12-12 18:17 似不是傻 阅读(470) 评论(1) 推荐(0) 编辑

2017年12月3日

爬取起点小说网(一)设计思想

摘要: Scrapy框架爬取起点小说网: (1)开始设计: 运用的工具:redis,mongodb,pychorm,python3.6环境 逻辑: 分析:先爬取起点小说网站的分类,和子分类;eg:玄幻是个大分类,下面还分有东方玄幻,异世大陆,王朝争霸,高武世界4个子分类 《1》第一步:我们先爬取起点小说网的 阅读全文

posted @ 2017-12-03 16:43 似不是傻 阅读(426) 评论(0) 推荐(0) 编辑

2017年11月15日

python爬取豆瓣登陆验证码

摘要: 先写一个爬取图片的方法 阅读全文

posted @ 2017-11-15 21:25 似不是傻 阅读(251) 评论(0) 推荐(0) 编辑

python爬去笔趣阁完整一本小说

摘要: python爬去笔趣阁完整一本小说,(后续会用多线程同时爬取多本小说,并放入数据库) 阅读全文

posted @ 2017-11-15 21:15 似不是傻 阅读(1699) 评论(1) 推荐(1) 编辑

把爬取到的链接放到数据库

摘要: 把爬取到的链接放到数据库 把注释的代码打开,就是把爬去到的链接写到文件夹中,不用创建文件夹,自动生成文件夹和html文档 阅读全文

posted @ 2017-11-15 21:08 似不是傻 阅读(338) 评论(0) 推荐(0) 编辑

2017年11月13日

python爬取网络图片

摘要: python爬取网络图片 阅读全文

posted @ 2017-11-13 21:17 似不是傻 阅读(570) 评论(0) 推荐(0) 编辑

导航