爬虫 - ljhhhhhh - 博客园

爬虫

一、python 连接测试URL

① 导入库

from requests import get

② 设定url, 并使用get方法请求页面得到响应

url = "https://hao.360.cn/"
r = get(url, timeout=3)
print("获得响应的状态码：", r.status_code)
print("响应内容的编码方式：", r.encoding)

运行结果：

获得响应的状态码： 200
响应内容的编码方式： ISO-8859-1

③ 获取网页内容

r.encoding = "utf-8"
url_text = r.text
print("网页内容：", r.text)
print("网页内容长度：", len(url_text))

运行结果：

网页内容： <!DOCTYPE html> <html> <head> ... 意见反馈</a> 京ICP证030173号  <img src=//www.baidu.com/img/gs.gif> </p> </div> </div> </div> </body> </html>

网页内容长度： 2287

二、python 连接360浏览器20次

①输入代码

"""
Spyder Editor

This is a temporary script file.
"""
import requests
def getHTMLText(url):
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding='utf-8'
        return r.text
    except:
        return "dddd"
url="https://hao.360.cn/"
print(getHTMLText(url))
    
for i in range(20):
   getHTMLText(url)
   print(i+1)

②效果如图

下图显示次数

posted on 2019-05-22 16:28 ljhhhhhh 阅读(185) 评论(0) 收藏举报

刷新页面返回顶部

ljhhhhhh

爬虫

一、python 连接测试URL

二、python 连接360浏览器20次

导航

公告