梨视频-python xpah综合应用
点击进入梨视频的详情页
贺娇龙"接班人"蔡宜芮回应质疑:是事业的接力_一手Video-梨视频官网-Pear Video-梨网站
按F12,打开“元素”标签,可见视频的链接如下所示:

但是,此链接使用xpath是抓取不到的。什么原因呢?
我们依据此页面中的class=main-video-box,在“网络”中进行查找,可以看到,同样的类标签,在原始返回的html中是没有.mp4相关内容的,这应该是经过js加解密后添加上去的,如下

网页应该是使用了Ajax进行了异步请求,所以在fetch/xhr中继续摸查一下,如下

标签中的视频地址:https://video.pearvideo.com/mp4/short/20260423/cont-1805914-16075654-hd.mp4
网络请求的视频地址:https://video.pearvideo.com/mp4/short/20260423/1777362371448-16075654-hd.mp4
分析一下数据包

通过请求https://www.pearvideo.com/videoStatus.jsp?contId=1805914&mrd=0.8195845196560378这个地址,来求得返回的数据
{'resultCode': '1', 'resultMsg': 'success', 'reqId': 'b8a35738-e0c7-47d2-8aeb-9773dbf73247', 'systemTime': '1777381082686', 'videoInfo': {'playSta': '1', 'video_image': 'https://image2.pearvideo.com/cont/20260423/cont-1805914-12801479.png', 'videos': {'hdUrl': '', 'hdflvUrl': '', 'sdUrl': '', 'sdflvUrl': '', 'srcUrl': 'https://video.pearvideo.com/mp4/short/20260423/1777381082686-16075654-hd.mp4'}}}
以上是请求回来的json数据。
标签中的视频地址:https://video.pearvideo.com/mp4/short/20260423/cont-1805914-16075654-hd.mp4
网络请求的视频地址:https://video.pearvideo.com/mp4/short/20260423/1777362371448-16075654-hd.mp4
第二次网络请求地址:https://video.pearvideo.com/mp4/short/20260423/1777381082686-16075654-hd.mp4
可以看到第二次的同样请求,对应的‘cont-1805914’是一直在动态变化的,其余的部分是不变的。
因此,只需要将变化的那部分内容替换成对应的‘cont-1805914’就是真实的HTML标签页中的地址了。

浙公网安备 33010602011771号