摘要: (一) 说明 在上一篇的基础上修改了下,使用lxml提取博客园随笔正文内容,并保存到Word文档中。 操作Word文档会用到下面的模块: pip install python-docx 修改的代码(主要是在link_crawler()的while循环中增加了下面这段) (二) 完整代码(delaye 阅读全文
posted @ 2018-04-10 18:36 free赖权华 阅读(2732) 评论(0) 推荐(0)
摘要: (一)代码1(link_crawler()和get_links()实现链接爬虫) (二)delayed.py(实现下载限速的类) 阅读全文
posted @ 2018-04-10 12:23 free赖权华 阅读(2262) 评论(0) 推荐(0)
摘要: (一) 三种网页抓取方法 1、 正则表达式: 模块使用C语言编写,速度快,但是很脆弱,可能网页更新后就不能用了。 2、 Beautiful Soup 模块使用Python编写,速度慢。 安装: pip install beautifulsoup4 3、 Lxml 模块使用C语言编写,即快速又健壮,通 阅读全文
posted @ 2018-04-09 10:19 free赖权华 阅读(2109) 评论(0) 推荐(1)
摘要: (一)安装xmlrunner 使用Jenkins执行测试时,测试代码中会用到这个模块。 pip install xmlrunner 下文安装Jenkins环境:Windows 10 Ubuntu安装Jenkins可参考:https://www.cnblogs.com/clemente/p/10642 阅读全文
posted @ 2018-03-14 20:08 free赖权华 阅读(4999) 评论(4) 推荐(0)
摘要: (一)方法 方法 简单说明 add_cookie(cookie_dict) 在当前会话中添加cookie信息 cookie_dict:字典,name和value是必须的 delete_all_cookies() 在当前会话中删除所有cookie信息 delete_cookie(name) 删除单个名 阅读全文
posted @ 2018-03-12 19:46 free赖权华 阅读(3744) 评论(3) 推荐(0)
摘要: (一) 方法 方法 简单说明 save_screenshot(filename) 获取当前屏幕截图并保存为指定文件 filename:路径/文件名 get_screenshot_as_base64() 获取当前屏幕截图base64编码字符串 get_screenshot_as_file(filena 阅读全文
posted @ 2018-03-09 19:59 free赖权华 阅读(766) 评论(0) 推荐(0)
摘要: (一) 方法 方法 简单说明 execute_async_script(script, args) 异步执行JS代码 script:被执行的JS代码 args:js代码中的任意参数 execute_script(script, args) 同步执行JS代码 script:被执行的JS代码 args: 阅读全文
posted @ 2018-03-08 22:13 free赖权华 阅读(7797) 评论(0) 推荐(0)
摘要: (一) 前言 Webdriver高级应用的API,允许我们模拟简单到复杂的键盘和鼠标事件,如拖拽操作、快捷键组合、长按以及鼠标右键操作,都是通过使用webdriver的Python API 中的ActionChains类实现的。 调用ActionChains类方法时,不会立即执行,而是将所有操作都存 阅读全文
posted @ 2018-03-08 22:11 free赖权华 阅读(1537) 评论(0) 推荐(0)
摘要: (一) 前言 简单的说就是分为2层,页面class 和测试class。 页面class:分为父类和子类(子类指具体的页面,每一个页面都创建一个类),父类中定义公有的属性和方法(操作)。 #对面向对象有了解的,应该很容易理解抽象出公有属性和方法的意思 #父类和子类我是按自己的理解进行描述的,或者可以说 阅读全文
posted @ 2018-03-05 20:23 free赖权华 阅读(2475) 评论(0) 推荐(0)
摘要: (一) 字符串 单引号、双引号、三重引号都可以作为字符串的开始和结束,三重引号可以直接输入多行字符串。三重引号可能一般是用来写多行注释。 (二) r和\ r使字符串成为原始字符串,忽略所有转义字符。 \是转义字符。 (三) 字符串下标和切片 (四) 字符串的in和not in (五) 改变大小写 方 阅读全文
posted @ 2018-03-03 20:52 free赖权华 阅读(553) 评论(0) 推荐(0)