摘要: #需要通过代码打开https://www.dytt8.net/网站,拿到网站内容 from urllib.request import urlopen #拿到urlopen import re content = urlopen("https://www.dytt8.net/").read().decode("gbk") #获取到最新电影的部分链接 #正则表达式,匹配字符串 lst = re.f... 阅读全文
posted @ 2019-07-31 12:17 嘘,在学习呢 阅读(720) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python #-*- coding:utf-8 -*- # requests:用来下载网页源代码的,等同urlopen() #Beautiful Soup,解析html,替代正则部分re #Html #BeautifulSoup().find("a") import requests import bs4 from bs4 import BeautifulSoup... 阅读全文
posted @ 2019-07-31 12:15 嘘,在学习呢 阅读(864) 评论(0) 推荐(0) 编辑