快速从html页面解析出数据

如何快速从html页面解析出我们想要的数据

爬虫基本入门方法

 

场景:

1、当接口返回接口为xml

2、想从页面上解析想要的数据文本

 

 

使用

pip3 install lxml

 

import request

from lxml import etree

 

r = requests.post(url,data).text

 

#复制html内容

html_demo = '  '

#使用etree.HTML 解析html的内容

#demo = etree.HTML(html_demo) 

demo = etree.HTML( r ) 

nodes = demo.xpath(' ')  #填xpath路径

 

#获取文本

t = nodes[0].text

print(t)

 

posted @ 2020-03-18 23:41  dearddu  阅读(1241)  评论(0编辑  收藏  举报