day10-影刀RPA下载梨视频

今日内容

1 使用影刀RPA获取梨视频

1.1 目标

# 1  获取 梨视频 人物板块下,两页的视频--》下载到本地

1.2 具体步骤

# 1 新建PC自动化应用
	-修改应用名字
    -修改应用图标
    。。。
    
# 2 获取系统文件夹路径
	-获取桌面路径--》把下载的视频放在桌面上
    
# 3 创建文件夹
	-在桌面创建video01文件夹
    
# 4 打开网页:输入地址https://www.pearvideo.com/category_1
	-已经有驱动了,不用装了
    
# 5 鼠标滚动【可以滑动多次,加载更多页】
	-加载下一页
    
# 6 循环相似元素
	-有很多相似的视频--》都获取到后--》一个个循环
    
 ## 6.1 获取元素 属性
	-一个标签a--》有很多属性--》href--》是一个超连接--》鼠标点击--》就会跳转到href对应的地址
    <a href="video_1805352"</a>
    
 ## 6.2 设置变量
	拼接成正常的视频地址:"https://www.pearvideo.com/"+video_1805352
    
    
 ## 6.3 打开视频详情地址

 ## 6.4 获取元素 属性-->src属性
<video src="https://video.pearvideo.com/mp4/short/20260308/cont-1805352-16073393-hd.mp4"></video>
 
 ## 6.5 http下载--》保存到video中--》视频名字?
	-https://video.pearvideo.com/mp4/short/20260308/cont-1805352-16073393-hd.mp4
    -video_1805352.mp4--->python 语法是:video_href +"mp4"
        
# 7 循环结束

1.3 流程截图

image-20260402203452500

image-20260402205034603

image-20260402205401123

image-20260402205618492

image-20260402210115837

image-20260402210442024

image-20260402211109364

image-20260402211333916

image-20260402213415655

扩展

获取视频标题

image-20260402214526112

打印日志

image-20260402214615352

爬取的时候,尽量加点等待-随机等待

image-20260402215410261

拓展--》爬更多页

同学问题

1 "字符串" 与 "None" 无法做 "+" 运算


2 老师,是不是所以网站或者APP取数据元素名字不一定都是SRC之类?
	-右键--》检查--》看到后--》去获取--》是什么就写什么
    
    
3 不编程,很多元素啊,变量啊名字都不熟悉 html
<html>
	<head></head>
    <div>
        <a class='ss' href='www.baidu.com'></a>
        <video src='视频地址' id='sss'></videw>
    </div>
</html>

4 问老师,还是要讲讲网页的基本术语,比如对象、元素、标签等
	-回答过了
    

5 梨视频网页点不开,总是提醒风险
	-爬的太多,封ip了
    -明天再试--》一定要加 等待

    
6 为什么我循环相似元素,捕获都是a标签,而不是a上级的div
	-用a 获取hrf属性
    -如果用div没有href属性



7 如果我运行的时候意外终止了,下次运行从头开始还是继续下载没下载的,如果是从头 怎么让他继续。而不是从头下载
	-逻辑问题--》不是技术问题
    	-影刀可以打开文件夹,读出文件夹中所有的文件--》拿到文件名--》只留 video_数字
		-解析出的video_href 循环跟每个 video_数字 --》如果想等--》就不下载这个了
        
        
        
8 点赞低于多少的不下载,怎么操作?

9 这个是视频,那如果去下载列表类型的元素信息是不是也一样的操作?比如去下载雷速体育赛事的相关信息?https://live.leisu.com/--->不行
    -如果是考试试题的网站,怎么爬文字的数据,整理成Excel
10 下载超时怎么解决?
	1 换网络环境,提高网速
    2 把超时时间 放大点

    
11 刚开始循环打开视频页面显示404是为什么

12 为啥我拿了一个视频就停了,循环没跑起来
	-在影刀操作过程中,不要动
    
    
13 在循环里,获取元素信息时,获取不到目标元素为:web_loop_element 的目标,怎么回事呢

14 如何修改错的指令,我的获取上出问题了,需要修改

15 谷歌浏览器不行,使用影刀浏览器

16 [WinError 3] 系统找不到指定的路径。: ''

image-20260402215816243


posted @ 2026-04-05 09:38  凫弥  阅读(2)  评论(0)    收藏  举报