一、环境部署
python+selenium+pycharm+webdriver
1、 python安装包:https://www.python.org/getit/
2、 PyCharm 安装包:http://www.jetbrains.com/pycharm/download/
3、 Selenium安装包:https://pypi.python.org/pypi/selenium
selenium安装方式一: 安装python包,选择全部组件(pip、安装过程中配置环境变量) 然后执行pip install -U selenium 联网安装Selenium;
安装方式二: 安装python包,选择全部组件(pip、安装过程中配置环境变量) 解压selenium-3.13.0.tar.gz,然后用cmd进入解压目录,使用命令 Python setup.py install 安装Selenium。
4、 webdriver配置(以chromedriver为例):
Chromedriver下载地址:http://npm.taobao.org/mirrors/chromedriver/ ***版本与浏览器版本保持一致
配置方式一: 1)把下载好的chromedriver.exe程序放置到python的安装路径下 2)在python中代码编写如下即可:
driver = webdriver.Chrome() # Firefox、Ie、Edge等
配置方式二: 1)把下载好的chromedriver.exe程序放置到python项目中(其它路径也可) 2)在python中代码编写如下即可:
chromePath = chromedriver.exe路径 os.environ[‘webdriver.chrome.driver’] = chromePath # gecko ie等
driver = webdriver.Chrome(executable_path=chromePath) # Firefox、Ie等
很长时间不用最好将本地的浏览器升级到最新版本
二、注意事项
1、把解压的webdriver放置到python根路径 ***在pycharm中创建目录存放webdriver
2、若安装的浏览器是火狐,则需安装在默认路径,否则易报错
3、写代码时,1)需从selenium中导入webdriver eg:from selenium import webdriver
2)需定义webdriver文件路径
chrome_driver_path=os.path.join(current,’..chromedriver文件存放的路径')
3)打开chrome浏览器语句
driver = webdriver.Chrome(executable_path=chrome_driver_path)
4)输入网址
driver.get(http://www.baidu.com)
三、识别元素
1. 基本元素定位
driver.find_element_by_id('id_value').send_keys('最新疫情咨讯') #通过id定位
driver.find_element_by_name('name_value').send_keys('最新疫情咨讯') #通过name定位
driver.find_element_by_class_name('class_name_value').send_keys('最新疫情信息') #通过class元素定位
driver.find_element_by_tag_name('input').send_key('最新疫情咨讯') #通过tag_name定位,<缺点:tag_name值不唯一>
driver.find_element_by_link_text('新闻').click() #link_text链接中的文本 <缺点:只对<a>标签生效>
driver.find_element_by_partial_link_text('新').click() #partial_link_text部分链接中的文本 <缺点:只对<a>标签生效>
2.xpath定位元素
driver.find_element_by_xpath('/html/body/div[1]/div/div[2]/form/span[1]/input') #绝对路径,单反斜线,遇到同层级多个元素,用下标从1开始,自顶向下写
driver.find_element_by_xpath('form/span[1]/input') #相对路径,双反斜线,遇到同层级多个元素,用下标从1开始,自底向上写
#属性定位 // 标签名[属性名=‘‘属性值’’]
driver.find_element_by_xpath('//input[@id=''kw'']').send_keys('新梦想')
#多属性定位 and or
driver.find_element_by_xpath('//input[@id=''kw''] and @maxlength=''225'']').send_keys('新梦想软测')
#支持通配符 *
driver.find_element_by_xpath('//*[@id=''kw'' ]').send_keys('新梦想软测')
#模糊定位,称为部分属性值定位
#字符串以特定值开头 //a[start-with(@参数1,‘‘参数值2’’)]
#以什么结尾 ends-with() #有的会报错,原因,
#包含 contain() 应用的场景(1、元素信息过长 2、动态属性元素,eg:始终点击第一个订单,即动态获取第一个订单号编码)
#元素文本定位 text() link_text只能用于a标签,局限性比较大,而xpath所有标签均支持
driver.find_element_by_xpath('//a[text()=''新闻'']').click()
3.css定位元素
《《《《《《《《同层级若遇到id用#号,遇到class用.
绝对路径
相对路径
多属性定位,只支持 and的效果
模糊定位,称为部分属性值定位
#查询子元素
# 子元素 a>b
driver.find_element_by_css_selector('').send_keys('天天开心')
# 后代元素 a b
driver.find_element_by_css_selector('').send_keys('天天向上')
# 第一个后代元素 :first-child
driver.find_element_by_css_selector('div#u1 a:first-child').click()
# 最后一个后代元素 :last-child
driver.find_element_by_css_selector('div#u1 a:laat-child').click()
第n个子元素 :nth-child(n)
兄弟元素 同层级的多个元素用+
新的定位语法 需导入by模块 更适合用在框架里面
driver.find_element(By.ID,'KW').send_keys('xmx')
浙公网安备 33010602011771号