上一页 1 2 3 4 5 6 7 ··· 28 下一页
摘要: selenium 谷歌浏览器驱动下载 查看驱动和浏览器版本映射关系 访问百度 滑动 PhantomJs 谷歌无头浏览器 前进和后退 动作链一 动作链二 阅读全文
posted @ 2019-05-05 21:33 答&案 阅读(2508) 评论(0) 推荐(0) 编辑
摘要: 代理:代理服务器 cookie的应用和处理 如何提升requests模块爬取数据的效率 多进程或者多线程(不建议) 线程池或者进程池(适当使用) 单线程+异步协程(推荐) 云打码平台注册和使用 相关的门户网站在进行登录的时候,如果用户连续登录的次数超过3次或者5次的时候,就会在登录页中动态生成验证码 阅读全文
posted @ 2019-05-05 20:58 答&案 阅读(726) 评论(0) 推荐(0) 编辑
摘要: 爬取搜狗指定词条搜索后的页面数据 爬取搜狗指定词条搜索后的页面数据 爬取百度翻译,页面中有可能会存在动态加载的数据 爬取的是豆瓣电影中的电影详情数据 注意:页面中有些情况下会包含动态加载的数据 爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据http://125.35.6.84: 阅读全文
posted @ 2019-04-29 16:42 答&案 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 现在,启动一个节点和kibana,接下来的一切操作都在kibana中Dev Tools下的Console里完成 创建一篇文档 将小黑的小姨妈的个人信息录入elasticsearch。我们只要输入 PUT表示创建命令。虽然命令可以小写,但是我们推荐大写 结果中的result则是操作类型,现在是crea 阅读全文
posted @ 2019-04-25 19:27 答&案 阅读(241) 评论(0) 推荐(0) 编辑
摘要: Celery 是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具。它是一个专注于实时处理的任务队列,同时也支持任务调度 安装celery 创建一个celery实例 创建s1文件 运行celery服务 调用任务(异步任务) 创建一个新文件,使用 delay() 方法 阅读全文
posted @ 2019-04-16 22:50 答&案 阅读(566) 评论(1) 推荐(0) 编辑
摘要: GitPython 是一个用于操作 Git 版本库的 python 包,它提供了一系列的对象模型(库 - Repo、树 - Tree、提交 - Commit等),用于操作版本库中的相应对象。 模块安装 初始化 操作 gitpython还可以直接操作git命令 阅读全文
posted @ 2019-04-16 18:12 答&案 阅读(13842) 评论(0) 推荐(0) 编辑
摘要: 参考 https://blog.51cto.com/wangfeng7399/2352669 有些时候,你必须把某些文件放到Git工作目录中,但又不能提交它们,比如保存了数据库密码的配置文件啦,等等,每次git status都会显示Untracked files ...,有强迫症的童鞋心里肯定不爽。 阅读全文
posted @ 2019-04-16 00:49 答&案 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 添加标签 查看版本 删除版本 git tag -a v0.1 df398b4 #哈希地址 写入版本描述 将本地标签推送到远程厂库 删除远程厂库标签 git push origin :refs/tags/v1.0 阅读全文
posted @ 2019-04-16 00:25 答&案 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 点击他人项目中的Fork 选择把分支创建在哪里 等待拷贝完成后,就可以修改了,修改完成后点击 选择Create pull request 此时项目的作者的 Pull requests会加一 此时如果项目作者就可以选择是否合并了你提交的代码 阅读全文
posted @ 2019-04-15 23:58 答&案 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 点击项目目录中的Settings 点击Collaborators 添加后,合作者会受到确认邮件,等待合作者确认后,合作者就可以提交了 添加组织 在Settings中找到Organizations 点击New organization 添加组织 写入必填信息 创建完成后,为组添加合作者 等待合作者邮件 阅读全文
posted @ 2019-04-15 23:31 答&案 阅读(3407) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 28 下一页