用python从某网站提取章节名称

 1 from turtle import title
 2 import requests
 3 from pyquery import PyQuery as pq
 4 
 5 headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}
 6 html=requests.get("https://www.??zxw.net/List.aspx?cid=664",headers=headers).text
 7 # print(html)
 8 data=pq(html)
 9 title_list=data(".chapters .title")
10 node_list=data(".chapters .node a").items()
11 #print("ret:",title_list)
12 for title in title_list:
13     print(title.text)
14 for node in node_list:
15     print(node.attr("title"))
16 # addr=ret.attr("src")
17 # print('address:',addr)

第6行:获取html

第8行:用pyquery处理html

第9行:获取章标题列表

第10行:获取节标题列表

第12-15行:打印章节内容

posted @ 2022-01-27 22:12  paoPaoLong_liu  阅读(85)  评论(0)    收藏  举报