day16-影刀RPA-01 自动下载热门视频

今日内容

1 介绍RPA

1.1 RPA是什么

# RPA（Robotic Process Automation，机器人流程自动化[自动化流程机器人]）是一种通过软件机器人（或称为 “数字员工”）模拟人类在计算机上的操作行为，来自动执行重复性、规则性业务流程的技术

1.2 RPA使用场景

# 功能作用
# 1 模拟人类操作：可自动完成点击、输入、复制、粘贴、数据提取、文件处理等操作。
	-web端：网页操作
    -手机端：app操作，微信小程序。。。
    -PC端：win 软件操作，文件夹操作。。。
# 2 基于规则驱动：需要明确的业务规则，当流程逻辑固定、输入输出可预期时，RPA 能高效运行。
	-开发了一个app--》换脸app---》公司需要有测试--》测试app的功能---》点击，输入，点击一套操作
# 3 非侵入式集成：无需改造现有 IT 系统（如 ERP、CRM、网页平台等），通过界面交互实现自动化，降低实施难度。
	-公司---》员工管理系统---》你是hr--》录入新员工---》100个
    -让100个新员工---》个人信息--》统计到excel表格中---》录入到我们系统
    -拿到excel表格了---》一条条录入--》非常耗时--》重复性操作
    -使用RPA编写一套流程---》自动的完成数据录入
    -我们没有改 ：员工管理系统  系统的源代码
    
    -侵入式集成：直接使用代码，操作数据库录入
    	-ai帮我们 写代码导入
    
# 4 提升效率与准确性：替代人工完成重复性工作，减少人为错误，同时可 7×24 小时不间断运行。
	
# 常见应用场景包括：
财务对账、发票处理、数据录入与迁移、报表生成、客服信息查询、供应链订单处理等
淘宝卖家---》批量发货
	-淘宝后台，一个个点击发货按钮
    	-我们发送了快递
        -买家看不到
        -淘宝后台点击发货按钮--》买家才能看到

1.3 目前主流RPA工具

## 1 国际知名产品
UiPath
全球市场份额领先的 RPA 工具，功能全面，支持可视化流程设计（拖拽式操作），适合复杂流程自动化。提供丰富的预置活动库（如 Excel、数据库、网页操作等），支持 AI 集成（如 OCR、自然语言处理），社区版免费供个人学习使用，企业版适合大型组织部署。

Automation Anywhere
另一国际巨头，以 “云原生” 为特色，支持云端部署和管理机器人，适合分布式团队协作。提供 “智商机器人”（IQ Bot），集成 AI 能力处理非结构化数据（如扫描件、手写体），适合需要智能处理的场景。

Blue Prism
较早进入 RPA 领域的工具，以 “企业级稳定性” 著称，严格遵循 IT 治理标准，适合对合规性、安全性要求高的行业（如金融、医疗）。流程设计更偏向代码逻辑，学习门槛稍高，多应用于大型企业核心业务流程。

## 2 国内主流产品
影刀 RPA（Yingdao）
国内市场表现突出的 RPA 工具，主打 “简单易用”，界面友好，适合无编程基础的用户快速上手。支持 Windows、网页、移动端应用自动化，集成了 OCR、API 调用等功能，在电商、零售、互联网行业应用广泛，提供免费版和企业版。

实在 RPA：AI能力是独一档的存在，开创 “RPA + 大模型” 模式——第三代RPA数字员工，在非结构化数据处理方面表现出色。实在 RPA 提供了高度定制化服务，其智能体（实在Agent）可自训练优化，能更好地适应复杂多变的业务场景。

八爪鱼 RPA：以简单易用、功能强大著称，提供了丰富的模板和组件，用户可通过拖拽式操作快速搭建自动化流程。八爪鱼 RPA 在电商、数据采集等领域应用广泛

来也科技（laiye）
结合 RPA 与 AI 能力（如对话机器人），形成 “RPA+AI” 解决方案。工具支持流程录制、可视化设计，适合政务、金融、制造业等场景，提供针对不同行业的预置模板，降低实施成本。

艺赛旗（IS-RPA）
国内较早自主研发的 RPA 工具，支持复杂流程自动化和大规模机器人管理，强调与企业现有系统的集成能力，在能源、物流等行业有较多案例。

## 3 开源框架   使用代码操作---》可操作性更强--》可定制性更强
Robot Framework：免费且灵活，具有强大的可扩展性和丰富的库支持。它采用关键字驱动的测试框架，易于学习和维护，适合小型团队和个人开发者进行自动化测试和流程自动化。

OpenRPA：社区活跃，提供了跨平台的自动化解决方案。OpenRPA 支持多种编程语言，能够与现有系统无缝集成，为开发者提供了广阔的创新空间。

1.4 使用RPAFramework自动刷抖音

# 必须用代码--》要求水平高---》早期开发人员---》给公司定制RPA工具
# 了解

# pip install rpaframework

from RPA.Browser.Selenium import Selenium
import time

class DouyinAutoScroller:
    def __init__(self):
        self.browser = Selenium()
    def open_douyin(self):
        """打开网页版抖音"""
        print("打开网页版抖音")
        self.browser.open_available_browser("https://www.douyin.com/")
        self.browser.maximize_browser_window()
        # 等待页面加载
        print("等待页面加载...")
        time.sleep(10)  # 初始等待时间，确保页面完全加载

    def run(self):
        """运行自动化流程"""
        try:
            print("===== 开始自动刷抖音流程 =====")
            self.open_douyin()
            print("===== 自动刷抖音流程完成 =====")
        except Exception as e:
            print(f"执行过程中发生严重错误: {str(e)}")
            raise
        finally:
            # 关闭浏览器
            self.browser.close_all_browsers()


if __name__ == "__main__":
    bot = DouyinAutoScroller()
    bot.run()

2 影刀RPA安装-注册-启动

# 1 图形化界面软件---》我们可以点点点，不需要写代码(影刀支持代码操作--如果会代码-更可定制)--》能够完成自动化的操作

# 2 下载软件，安装到电脑上---》mac、win、linux---》不断更新迭代--》后期可能会越来越强大
	-https://www.yingdao.com/product/
    -win：功能最全，最新功能在上面
    -Mac：阉割版，有的功能只能win有，mac没有---》不讲mac的使用
    	-mac装个win虚拟机
    -信创系统（如统信UOS、银河麒麟、Linux）
    
    
# 3 下载免费版
	-目前免费
    -企业版：扫码获取企业服务--》跟企业对接
    
    
# 4 安装

# 5 桌面双击打开

# 6 注册完账号（社区版：足够用）（企业版收费）

# 7 登录进去

3 使用RPA自动下载热门视频

# 0 使用影刀RPA可以实现
	-操作web：网页：抖音，小红书，bilibil，京东自动秒杀商品，12306买票。。。
    	-点击：抖音点赞
        -评论：自动评论
        -数据抓取：下载小说，图片，视频。。。。
        -允许人来操作的：百度文库---》一篇pdf---》你账号(非会员)登录后--》不能下载---》能用影刀自动下载吗？
        -自动化下载---》可以
	-操作PC端：
    	-百度网盘软件：把百度网盘中的学习视频资料--》都下载到本地
        -微信/qq: 自动回复，自动发送文件
        -win机器上装的软件--》自动化操作
        	-游戏自动挂机
            
   -操作手机：够用：【手机连接到电脑上：电脑上使用影刀，手机上安装对应app】
		-美团app抢优惠券
    	-各种app的自动化操作
		-手机可以正常使用即可
        	-自动操作手机，模拟人的行为
        
# 1 目标：
	-使用影刀RPA打开 梨视频 ---》自动下载热门视频到本地
    - 数据抓取[爬虫：获取互联网中的数据]
    
    
# 2 使用影刀流程
	1 获取桌面地址
    2 在桌面上创建一个文件夹[视频]--》存放视频
    3 打开网页：梨视频
    4 鼠标滚动【加载下一页】：案例中滚了一次[获取两页的数据]
    	-自行滚更多页码--》获取更多视频
        
   5 循环 每一个视频
   	 5.1 获取每一个视频地址
     5.2 打开每个视频地址
     5.3 获取网页中视频的链接地址  xx.mp4
     5.4 下载这个视频，放到文件夹中
   6 结束循环

3.1 步骤

# 1 新建PC自动化应用

# 2 获取系统文件夹路径

# 3 创建视频文件夹：在桌面

# 4 打开网页：第一次会提示装驱动
	使用谷歌浏览器：跟我一致，如果没有谷歌浏览器，要先安装一个
    需要装谷歌浏览器驱动：影刀自动操作谷歌浏览器需要这个扩展软件
# 5 安装驱动
	https://www.yingdao.com/yddoc/rpa/710821364073103360
        
# 6 鼠标滚动

# 7 循环相似元素--》一定找到a标签
	-捕获元素
    -捕获相似元素--》把当前页面中所有一样的，都选出俩
    -一个个循环它
# 7.1 获取元素信息
	-href信息
    
# 7.2 设置变量
	-拼接上前面地址：https://www.pearvideo.com/+href信息
    -变成这种地址：https://www.pearvideo.com/video_1802264
        
# 7.3 打开视频详情地址
	-打开网页：选择网页地址为上面的变量
    
# 7.4 获取元素信息
	-获取video的src属性---》是mp4地址

4 下载视频优化

# 1 重新理一下过程
	1 获取桌面地址[影刀提供给我们的]--》设置给一个变量：dir_path
    	-获取系统文件路径：桌面，下载地址，图片地址。。。。
    2 创建文件夹---》设置给一个变量：new_folder
    	-创建文件夹：在 dir_path  下面创建
        -父目录是：dir_path--》点击fx--》可以选
        -新建文件夹名字：视频---》桌面创建出一个文件夹叫  视频
        
    3 打开网页----》设置给一个变量：web_page
    	-使用谷歌浏览器
        -装驱动：保证彩色的才可以用
        	-作用：后续我们选择元素，捕获元素用
    4 一打开就往下滑动网页--》太像机器了--》容易被对应的网址给记录--》不允许你访问
    	-等待2s
    5 鼠标滚动网页
    	
    6 循环相似元素--》每一个元素的变量名：web_loop_element
    	-捕获相似元素
        
    6.1 获取每个元素的 href属性--》a标签的href属性--》变量名：video_href--》video_1802564
    	-超链接---》点击可以跳转到另一个页面---》前端知识---》不需要了解
        
    6.2 设置变量---》变量名:video_url
    	-由于a标签的href属性只有：video_1802564
        -我们要拼成：https://www.pearvideo.com/video_1802564
        -python代码："https://www.pearvideo.com/"+video_href
        
    6.3 打开网页：一个个视频--》这个在循环中--》设置给一个变量：web_page2
    	-打开地址：video_url
    6.4 获取元素信息：获取视频地址：mp4---》video_mp4
    	-捕获video标签--》获取它的元素--》src
    6.5 下载视频：http下载
    	-下载地址：video_mp4
        -保存到：new_folder
        -指定文件名：video_href+".mp4"
        
# 扩展----

# 1 修改成 视频名字--》作为下载的视频名
	-获取视频标题
    -存在问题：特殊字符不能做名字

# 2 每次打开一个新的页面，为了防止反扒，都要等待1s