Python批量获取网页内以某种方式开头的链接

# coding=utf-8
import requests
import re
from bs4 import BeautifulSoup

url = 'XXX'
r = requests.get(url)
r.encoding = 'gb2312'
soup = BeautifulSoup(r.text, 'lxml')
links = []
for a in soup.find_all('a'):
    link = a['href']
    links.append(link)

print(links)
zhuanti =[]
for i in links:
    if str(i).startswith("XXX"):
        zhuanti.append(i)
print(zhuanti)

　　

posted @ 2019-08-25 00:03 胡小易阅读(768) 评论(0) 收藏举报

刷新页面返回顶部