利用正则得到页面邮箱

#coding=utf-8
#python2.7实现

from selenium import webdriver

import re

dr = webdriver.Chrome()

dr.maximize_window()

dr.implicitly_wait(6)

dr.get("http://home.baidu.com/contact.html")
#得到页面源代码

doc = dr.page_soruce
# 利用正则,找出 xxx@xxx.xxx 的字段,保存到emails列表
emails = re.findall(r'[\w]+@[\w\.-]+',doc)
# 循环打印匹配的邮箱
for email in emails:
print(email)

posted on 2017-11-29 13:10  sunny_2016  阅读(143)  评论(0)    收藏  举报

导航