用python从某网站提取章节名称
1 from turtle import title 2 import requests 3 from pyquery import PyQuery as pq 4 5 headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"} 6 html=requests.get("https://www.??zxw.net/List.aspx?cid=664",headers=headers).text 7 # print(html) 8 data=pq(html) 9 title_list=data(".chapters .title") 10 node_list=data(".chapters .node a").items() 11 #print("ret:",title_list) 12 for title in title_list: 13 print(title.text) 14 for node in node_list: 15 print(node.attr("title")) 16 # addr=ret.attr("src") 17 # print('address:',addr)
第6行:获取html
第8行:用pyquery处理html
第9行:获取章标题列表
第10行:获取节标题列表
第12-15行:打印章节内容

浙公网安备 33010602011771号