第一个爬虫与测试
第一个爬虫和测试
一、完善球赛程序,测试你写的球赛程序,所有函数的测试结果
实例代码
预测球队比赛结果代码:
def GameOver(a,b):
if a>=10 and b>=10:
if abs(a-b)==2:
return True
if a<10 or b<10:
if a==11 or b==11:
return True
else:
return False
测试:
1 def GameOver(a,b): 2 if a>=10 and b>=10: 3 if abs(a-b)==2: 4 return True 5 if a<10 or b<10: 6 if a==11 or b==11: 7 return True 8 else: 9 return False 10 try: 11 c=GameOver(15,13) 12 print(c) 13 except: 14 print("error")

运行结果正确
二、使用request库的get()函数访问百度网页20次并且打印返回状态,text内容,计算text()属性和content()属性所返回网页内容的长度
1.访问一次
a.代码
import requests
r = requests.get("http://www.google.cn",timeout=30)
print("状态 = {}".format( r.status_code))
print("text内容 = {}".format(r.text))
print("text编码方式 = {}".format(r.encoding))
print("二进制形式 = {}".format(r.content))
b.结果



2、访问20次
a、代码
import requests
for i in range(20):
r = requests.get("http://www.google.cn",timeout=30)
print("状态 = {}".format( r.status_code))
print("text编码方式 = {}".format(r.encoding))
print("text内容 = {}".format(r.text))
print("二进制形式 = {}".format(r.content))
b、结果
http://localhost:8888/notebooks/Untitled15.ipynb?kernel_name=python3
太长了可以自行查看👆
三、HTML页面的简单操作
a、代码
import requests
from bs4 import BeautifulSoup
soup = BeautifulSoup("<!DOCTYPE html><html><head><meta charset=‘utf-8‘>\
<title菜鸟教程(rounoob.com)</title></head><body>\
<h1>我的第一标题</h1>\
<p id='first'>我的第一个段落。</p></body>\
<table border=‘1‘><tr><td>row 1,cell 1\
</td><td>row 1,cell 2</td></tr><tr><td>row 2,cell 1\
</td><td>row 2,cell 2</td></tr</table></html>")
print(soup.head,"06") #获取并打印head标签的内容和学号后两位
print(soup.body) #获取并打印body的内容
print(soup.find_all(id="first")) #获取并打印id为first的文本
print(soup.h1.string,soup.p.string) #获取并打印html页面中的中文字符
b、结果

浙公网安备 33010602011771号