2021 年 1月 8 日随笔档案 - 白天的影子

selenium 中的显示等待WebDriverWait与条件判断expected_conditions举例

摘要： #coding=utf-8 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as 阅读全文

posted @ 2021-01-08 07:35 白天的影子阅读(292) 评论(0) 推荐(0)

requests库session保持持久会话

摘要： requests中cookie的原理 http://blog.csdn.net/zhu_free/article/details/50563756 requests - cookies的实现例子 http://www.cnblogs.com/nizhihong/p/6699492.html 在请求中阅读全文

posted @ 2021-01-08 07:34 白天的影子阅读(629) 评论(0) 推荐(0)

Python 字符串常用方法总结

摘要：明确：对字符串的操作方法都不会改变原来字符串的值 1、去掉空格和特殊符号 name.strip() 去掉空格和换行符 name.strip('xx') 去掉某个字符串 name.lstrip() 去掉左边的空格和换行符 name.rstrip() 去掉右边的空格和换行符 2、字符串的搜索和替换 na 阅读全文

posted @ 2021-01-08 07:12 白天的影子阅读(103) 评论(0) 推荐(0)

selenium 对浏览器标签页进行关闭和切换

摘要：关闭标签页 # 1.关闭浏览器全部标签页 driver.quit() # 2.关闭当前标签页（从标签页A打开新的标签页B，关闭标签页A） driver.close() 切换标签页 from selenium import webdriver browser=webdriver.Firefox() b 阅读全文

posted @ 2021-01-08 07:06 白天的影子阅读(2120) 评论(0) 推荐(0)

selenium等待presence_of_element_located

摘要：页面元素等待处理。显性等待： EC.presence_of_element_located((By.ID,"acdid")) '强制等待的办法也可以用sleep(3)，但是不是最好的方法 util.browser.find_element_by_id("acdid").click() 隐性等待：# 阅读全文

posted @ 2021-01-08 07:03 白天的影子阅读(6327) 评论(0) 推荐(1)

selenium.webdriver.common.by之By

摘要： By支持的定位： CLASS_NAME = 'class name' CSS_SELECTOR = 'css selector' ID = 'id' LINK_TEXT = 'link text' NAME = 'name' PARTIAL_LINK_TEXT = 'partial link tex 阅读全文

posted @ 2021-01-08 07:01 白天的影子阅读(673) 评论(0) 推荐(0)

Python中的pandas库

摘要：导入包 import pandas as pd import numpy as np 提供高性能医用的数据类型和分析工具 pandas基于numpy实现，常与numpy和matplotlib一同使用 pandas的核心数据结构 series是一种类似于一维数组的对象，它由一维数组以及一组与之相关的数阅读全文

posted @ 2021-01-08 06:33 白天的影子阅读(405) 评论(0) 推荐(0)

python中的Numpy库

摘要：导入numpy库： import numpy as np python的一个科学计算库的一个基础包，包含了强大的N维数组对象和向量运算数组创建，可以使用array函数从常规的python列表和或元组中创建数组，得到的类型是从列表元素中农推导出来的使用array函数创建数组，他接受一切序列型的对象阅读全文

posted @ 2021-01-08 06:25 白天的影子阅读(276) 评论(0) 推荐(0)

爬虫基础：Selenium库

摘要：什么是Selenium库 Selenium是自动化测试工具，支持多种浏览器，爬虫中主要用来解决JavaScript渲染的问题可以用Selenium来完成网页的下拉，点击等等操作。可以完全模拟浏览器加载网页，点击按钮，就像人一样。如何安装 pip3 install selenium 用法讲解基本阅读全文

posted @ 2021-01-08 06:13 白天的影子阅读(453) 评论(0) 推荐(0)

爬虫基础：PyQuery

摘要：什么是PyQuery PyQuery是强大又灵活的网页解析库。如果熟悉jQuery的语法，那么PyQuery就是你的绝佳选择安装PyQuery pip3 install PyQuery 用法讲解初始化字符串初始化常用在得到网页源代码，然后进行解析。 html = """ <div> <ul> 阅读全文

posted @ 2021-01-08 05:49 白天的影子阅读(131) 评论(0) 推荐(0)

爬虫基础：BeautifulSoup网页解析库

摘要： BeautifulSoup BeautifulSoup是灵活又方便的网页解析库，处理高效，支持多种解析器。利用它不用编写正则表达式即可以方便地实现网页信息的提取安装BeautifulSoup pip3 install beautifulsoup4 BeautifulSoup用法解析库解析库使用阅读全文

posted @ 2021-01-08 05:25 白天的影子阅读(1710) 评论(0) 推荐(0)

爬虫基础：正则表达式

摘要：什么是正则表达式正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、以及这些特定字符的组合，组成一个“规则字符串”，这个规则字符串用来表达对字符串的一种过滤逻辑 Python用re模块实现在线正则表达式工具其中有许多常用的正则表达式，非常好用。一般的网页可以用beauti 阅读全文

posted @ 2021-01-08 04:50 白天的影子阅读(215) 评论(0) 推荐(0)

爬虫基础：重要的requests库

摘要：什么是Request库 Requests是用Python语言编写，基于urllib，采用Apache2 Licensed开源协议的HTTP库。它比urllib更加方便，可以节约我们大量的工作，完全满足HTTP测试需求。一句话--Python实现的简单易用的HTTP库。安装Requests pip3 阅读全文

posted @ 2021-01-08 04:27 白天的影子阅读(162) 评论(0) 推荐(0)

白天的影子

公告