随笔分类 -  爬虫

摘要:爬虫基础知识(玖)Redis事务及乐观锁、Redis消息订阅及其持久化处理 阅读全文
posted @ 2020-02-24 21:00 如心幻雨 阅读(179) 评论(0) 推荐(0)
摘要:爬虫基础知识(捌)Redis基础知识及其数据类型和相关操作 阅读全文
posted @ 2020-02-23 16:37 如心幻雨 阅读(161) 评论(0) 推荐(0)
摘要:爬虫基础知识(柒)MongoDB数据库的概念及其一些操作 阅读全文
posted @ 2020-02-22 11:11 如心幻雨 阅读(162) 评论(0) 推荐(0)
摘要: 多线程爬虫、python中的threading模块、多线程与多进程 阅读全文
posted @ 2020-02-18 17:45 如心幻雨 阅读(145) 评论(0) 推荐(0)
摘要:爬虫基础知识(伍)爬虫和反爬虫的斗争、selenium+phantomjs 阅读全文
posted @ 2020-02-17 20:57 如心幻雨 阅读(168) 评论(0) 推荐(0)
摘要: XML、XML和HTML的区别、xpath语法、lxml模块 阅读全文
posted @ 2020-02-15 10:05 如心幻雨 阅读(161) 评论(0) 推荐(0)
摘要: cookie和session,代理,正则表达式 阅读全文
posted @ 2020-02-13 19:13 如心幻雨 阅读(234) 评论(0) 推荐(1)
摘要:一、requests模块 (一)requests模块简介: urllib和requests模块是发起http请求最常见的模块。 需要安装:pip install requests (二)requests模块的get方法: 1、response=requests.get( url=请求URL地址, h 阅读全文
posted @ 2020-02-12 17:03 如心幻雨 阅读(139) 评论(0) 推荐(0)
摘要:一、数据的由来 数据如果想要发挥它的作用,必须要分析。 爬虫最重要的作用就是获取数据。 二、爬虫的定义 (1)定义:爬虫就是自动抓取互联网信息的脚本或者程序。 (2)爬虫可以解决的问题。 a、解决冷启动问题。 b、搜索引擎的根基:做搜索引擎少不了爬虫。 c、建立知识图谱,帮助建立机器学习知识图谱。  阅读全文
posted @ 2020-02-12 17:02 如心幻雨 阅读(369) 评论(0) 推荐(0)