2020 年 6月 11 日随笔档案 - udbful

2020年6月11日

摘要： # 1、获取所有tr标签 1 from bs4 import BeautifulSoup 2 text = """ 3 <table class="tablelist" cellpadding="0" cellspacing="0"> 4 <tbody> 5 <tr class="h"> 6 <td 阅读全文

posted @ 2020-06-11 15:33 udbful 阅读(880) 评论(0) 推荐(0)

15 Beautiful Soup（提取数据详解find_all()）

摘要： # 1、获取所有tr标签# 2、获取第2个tr标签# 3、获取所有class等于even的tr标签# 4_1、将所有id等于test,class也等于test的所有a标签提取出# 4_2、获取所有a标签下href属性的值# 5、获取所有的职位信息（纯文本） # 1、获取所有tr标签 1 from b 阅读全文

posted @ 2020-06-11 11:18 udbful 阅读(3565) 评论(0) 推荐(0)

14 天堂电影信息爬取

摘要： 1 """电影天堂爬虫""" 2 3 4 import requests 5 from lxml import etree 6 7 BASE_DOMAIN = 'https://dytt8.net/' 8 HEADERS = { 9 'User-Agent': 'Mozilla/5.0' 10 } 阅读全文

posted @ 2020-06-11 01:19 udbful 阅读(439) 评论(0) 推荐(0)

公告