上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 83 下一页
摘要: [toc] 1.下载XPath Helper 链接:https://pan.baidu.com/s/1ZWxsxauHaBSkK2ItjhPNwQ 提取码:9yg2 2.解压与安装 2.1 解压 先解压xpath helper.rar,下载后的压缩包如下图: 解压后即可得到文件:xpath help 阅读全文
posted @ 2020-03-27 15:29 OLIVER_QIN 阅读(587) 评论(0) 推荐(1) 编辑
摘要: [toc] 1.需求描述 爬取豆瓣即将上映的电影信息,如下图,地址: 需要将每部电影的【名称、地区、时长、导演、主演】等信息爬取下来,以下是具体实现代码。 2.实现代码 代码运行结果截图: 阅读全文
posted @ 2020-03-27 10:27 OLIVER_QIN 阅读(338) 评论(0) 推荐(0) 编辑
摘要: [toc] 1.什么是XPath? xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历。 2.XPath开发工具 Chrome插件XPath Helper(启动快捷键:ctrl + shift + x) F 阅读全文
posted @ 2020-03-26 22:06 OLIVER_QIN 阅读(312) 评论(0) 推荐(0) 编辑
摘要: [toc] 1.需求描述 在 下有以下文件,如下图: 要求 : 将Logan开头的文件名全部修改为工作文档 其他的文件名称全部添加前缀"工作文档_" 实现后的结果如下: 2.实现代码 上述代码虽然也能实现,但是有个问题,如果【其他】文件夹下有文件,也会被修改文件名,这显然不是我们所希望的,所以就有了 阅读全文
posted @ 2020-03-26 16:56 OLIVER_QIN 阅读(963) 评论(0) 推荐(0) 编辑
摘要: [toc] 虽然Python中的标准库urllib模块已经可以满足我们的大多数需求,但是它的API使用起来让人感觉不是很好,而requests宣传是 ,说明使用更简洁方便。 1.安装和文档地址 安装 文档地址 中文文档:https://cn.python requests.org/zh_CN/lat 阅读全文
posted @ 2020-03-26 14:05 OLIVER_QIN 阅读(305) 评论(0) 推荐(0) 编辑
摘要: [toc] 1.操作数据 2.保存数据 保存数据最安全的方法是使用 方法 案例演示: 注意:该操作将覆盖已有文件而不会给出警告 3.装载文件 导入 来打开已有的工作簿: 阅读全文
posted @ 2020-03-26 10:39 OLIVER_QIN 阅读(373) 评论(0) 推荐(0) 编辑
摘要: [toc] 1.什么是cookie? 在网站中,http的请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。cookie的出现就是为了解决这个问题,第一次登陆服务器返回一些数据(cookie)给浏览器,然后浏览器保存到本地,当该用户第二次 阅读全文
posted @ 2020-03-25 22:19 OLIVER_QIN 阅读(449) 评论(0) 推荐(0) 编辑
摘要: [toc] 很多网站会监测一段时间内某个IP访问的次数(通过数据流量和日志等),如果访问的次数多的不像正常人,它就会把这个IP地址封了。所以我们就需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬。 常用的代理服务器: 西刺免费代理IP:https://www.x 阅读全文
posted @ 2020-03-25 18:32 OLIVER_QIN 阅读(358) 评论(0) 推荐(0) 编辑
摘要: [toc] 需要操作Excel,那么首先需要的操作工作簿对象,这是Excel的根本,以下是集中操作方法。 1.创建工作簿 1.1 直接使用 没必要先在文件系统上创建一个工作簿,然后再操作它,在Python中可以直接导入Workbook类并开始使用 1.2 创建的工作簿至少含有一个工作表 1.3 创建 阅读全文
posted @ 2020-03-25 17:54 OLIVER_QIN 阅读(921) 评论(0) 推荐(0) 编辑
摘要: [toc] 1.安装第三方库 1.1 常规安装 1.2 快速安装 切换到国内的镜像源,速度相对会快些,国内镜像源如下: (1)阿里云 https://mirrors.aliyun.com/pypi/simple/ (2)豆瓣 https://pypi.douban.com/simple/ (3)清华 阅读全文
posted @ 2020-03-25 14:25 OLIVER_QIN 阅读(450) 评论(0) 推荐(0) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 83 下一页