摘要: # 1、获取所有tr标签 1 from bs4 import BeautifulSoup 2 text = """ 3 <table class="tablelist" cellpadding="0" cellspacing="0"> 4 <tbody> 5 <tr class="h"> 6 <td 阅读全文
posted @ 2020-06-11 15:33 udbful 阅读(880) 评论(0) 推荐(0)
摘要: # 1、获取所有tr标签# 2、获取第2个tr标签# 3、获取所有class等于even的tr标签# 4_1、将所有id等于test,class也等于test的所有a标签提取出# 4_2、获取所有a标签下href属性的值# 5、获取所有的职位信息(纯文本) # 1、获取所有tr标签 1 from b 阅读全文
posted @ 2020-06-11 11:18 udbful 阅读(3565) 评论(0) 推荐(0)
摘要: 1 """电影天堂爬虫""" 2 3 4 import requests 5 from lxml import etree 6 7 BASE_DOMAIN = 'https://dytt8.net/' 8 HEADERS = { 9 'User-Agent': 'Mozilla/5.0' 10 } 阅读全文
posted @ 2020-06-11 01:19 udbful 阅读(439) 评论(0) 推荐(0)