selenium 页面加载以及4种等待

1、页面加载

1.1、页面加载超时设置

通过driver.set_page_load_timeout()来设置页面加载超时时间

1.2、页面加载策略设置

首选需要明白的一点是，如果什么都不设置，通常，以chrome浏览器为例，所有的元素定位是在页面被完全加载后（页面tab不再转圈）才开始。

有时候其实想要的元素已经加载出来了，只是页面还在加载其他东西，例如图片，此时若不想继续等待直接执行元素定位操作，则需要在创建driver的时候设置页面加载策略：

当调用driver.get("https://xxxx.xxx.xxx")来访问某页面时，get方法通常会阻塞浏览器直到页面完全加载后才执行后面的动作，若一个页面加载过慢，则会导致get方法一直阻塞。有时候希望页面在加载过程中就开始检测元素是否存在，而不是等到页面加载完了才开始检测，想要实现这个效果，可以用DesiredCapabilities类下的setPageLoadStrategy方法（Python，Chrome浏览器）：

from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium.webdriver.support.ui import WebDriverWait

desired_capabilities = DesiredCapabilities.CHROME # 修改页面加载策略
desired_capabilities["pageLoadStrategy"] = "none" # 注释这两行会导致最后输出结果的延迟，即等待页面加载完成再输出
#注：2021/12/20 在谷歌浏览器96.0.4664.110上验证出效果。


driver = webdriver.Chrome('browsers/chromedriver.exe')
wait = WebDriverWait(driver, 10) #后面可以使用wait对特定元素进行等待

driver.get('http://qzone.qq.com/')
# some code to work.

print("Reach end.")

其中PageLoadStrategy有三种选择：

(1) none: 当html下载完成之后，不等待解析完成，selenium会直接返回

(2) eager: 要等待整个dom树加载完成，即DOMContentLoaded这个事件完成，仅对html的内容进行下载解析。注：在谷歌浏览器96.0.4664.110验证不支持eager。

(3) normal: 即正常情况下，selenium会等待整个界面加载完成（指对html和子资源的下载与解析,如JS文件，图片等，不包括ajax）

以下这段来自https://blog.csdn.net/wkb342814892/article/details/81611737，感谢原作者

实际上，对于一个新加载的dom，页面啥时候开始接受命令由页面的加载策略决定，也就是说，我们通过修改页面加载策略，可以使页面即使处于加载中，也能接受我们的命令，从这点可以解决webdriver.get的阻塞问题。而每类webdriver都有一个对应的配置文件放在特定的类DesiredCapabilities里面，通过修改里面的pageLoadStrategy，可以使webdriver的页面加载策略发生改变。

上面的代码用了最后一种解析方式——none，不作等待，直接返回，然后在后面的代码中可以用explicit_wait或者implicit_wait等方式来对特定元素进行等待捕捉。

2、4种等待

UI自动化测试，大多都是通过定位页面元素来模拟实际的生产场景操作。但在编写自动化测试脚本中，经常出现元素定位不到的情况，究其原因，无非两种情况：1、有frame；2、没有设置等待。

因为代码运行速度和浏览器加载渲染速度，不是一个量级，所以导致了这种情况发生。webdriver提供了3种类型的等待：显式等待、隐式等待、强制等待。

2.1、强制等待

即sleep()方法，由python中的time模块提供，强制让代码等待xxx时间，无论前面的代码是否执行完成或者还未完成，都必须等待设定的时间。

不建议用这种等待方法，严重影响代码的执行速度。

示例代码如下：

 1 # coding = utf-8
 2 from selenium import webdriver
 3 from time import sleep
 4  
 5 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe")
 6 driver.get('http://www.cnblogs.com/imyalost/')
 7 
 8 sleep(5)
 9  
10 print(driver.current_url)
11 driver.quit()

代码解析：

本例中，设置强制等待时间为5秒，5秒之后，打印获取到的当前页面的url，然后关闭窗口。

这种强制等待的方法，在debug时候很有用，不过建议慎用这种方法，因为太死板，严重影响程序执行速度！

2.2、隐式等待

隐式等待是设置全局的查找页面元素的等待时间，在这个时间内没找到指定元素则抛出异常，只需设置一次。

driver.manage().timeouts().implicitlyWait(10,TimeUnit.SECONDS);

所有的findElement方法都会隐式等待10s

2.3、显示等待

定义：等待某个条件成立时继续执行，否则在达到最大时长时抛出异常（TimeoutException）;

WebDriverWait类是由webdriver提供的等待方法，配合该类提供的until()和until_not()方法一起使用，就可以根据判断条件而灵活进行等待，格式如下：

1 WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
2 driver:浏览器驱动
3 timeout:最长超时时间
4 poll_frequency:检测间隔时间，默认0.5s
5 ignored_exceptions:超时后的异常信息，默认情况抛出NoSuchElementException异常

6 WebDriverWait()一般由until()或until_not方法配合使用，下面是这两种方法的说明：
7 until(method,message=''):调用该方法提供的驱动程序作为一个参数，直到返回值为True;
8 until_not(method,message=''):调用该方法提供的驱动程序作为一个参数，直到返回值为Flase;

示例代码如下：

 1 # coding = utf-8
 2 from selenium import webdriver
 3 from selenium.webdriver.support.wait import WebDriverWait
 4 from selenium.webdriver.support import expected_conditions as EC
 5 from selenium.webdriver.common.by import By
 6  
 7 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe")
 8 driver.implicitly_wait(10)
 9 driver.get('http://www.cnblogs.com/imyalost/')
10 locator = (By.LINK_TEXT, '老_张')
11  
12 try:
13     WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator))
14     print(driver.find_element_by_link_text('老_张').get_attribute('href'))
15 finally:
16     driver.close()

代码解析：

本例中，通过as关键字将expected_conditions重命名为EC，并调用presence_of_element_located()方法判断元素是否存在；

上面的例子中，同时使用了隐性等待和显性等待，但是需要注意的是：等待的最长时间取两者之中的最大值；

expected_conditions类提供的预期条件判断方法如下：

 1 title_is： 判断当前页面的title是否完全等于（==）预期字符串，返回布尔值
 2 title_contains : 判断当前页面的title是否包含预期字符串，返回布尔值
 3 presence_of_element_located : 判断某个元素是否被加到了dom树里，并不代表该元素一定可见
 4 visibility_of_element_located : 判断某个元素是否可见. 可见代表元素非隐藏，并且元素的宽和高都不等于0
 5 visibility_of : 跟上面的方法做一样的事情，只是上面的方法要传入locator，这个方法直接传定位到的element就好了
 6 presence_of_all_elements_located : 判断是否至少有1个元素存在于dom树中。举个例子，如果页面上有n个元素的class都是‘column-md-3‘，那么只要有1个元素存在，这个方法就返回True
 7 text_to_be_present_in_element : 判断某个元素中的text是否 包含 了预期的字符串
 8 text_to_be_present_in_element_value : 判断某个元素中的value属性是否 包含 了预期的字符串
 9 frame_to_be_available_and_switch_to_it : 判断该frame是否可以switch进去，如果可以的话，返回True并且switch进去，否则返回False
10 invisibility_of_element_located : 判断某个元素中是否不存在于dom树或不可见
11 element_to_be_clickable : 判断某个元素中是否可见并且是enable的，这样的话才叫clickable
12 staleness_of : 等某个元素从dom树中移除，注意，这个方法也是返回True或False
13 element_to_be_selected : 判断某个元素是否被选中了,一般用在下拉列表
14 element_selection_state_to_be : 判断某个元素的选中状态是否符合预期
15 element_located_selection_state_to_be : 跟上面的方法作用一样，只是上面的方法传入定位到的element，而这个方法传入locator
16 alert_is_present : 判断页面上是否存在alert

2.4、流畅等待： FluentWait

与显示等待的 WebDriverWait类似，区别是WebDriverWait已经设置好几个等待条件，而流畅等待 FluentWait可以自己设置等待条件。

3、如何提高运行速度

设置等待时间的时候，少用sleep，尽量不用implicitly_wait，多用显式等待方法；

参考链接：

https://www.cnblogs.com/imyalost/p/7420924.html

https://www.cnblogs.com/qianjin100/p/9910699.html

https://blog.csdn.net/ouyanggengcheng/article/details/83036680

posted @ 2021-12-17 16:35 超级宝宝11 阅读(12175) 评论(0) 收藏举报

刷新页面返回顶部

超级宝宝11