day14-影刀RPA-01
今日内容
1 RPA介绍
1.1 RPA是什么
# RPA(Robotic Process Automation,机器人流程自动化[自动化流程机器人])是一种通过软件机器人(或称为 “数字员工”)模拟人类在计算机上的操作行为,来自动执行重复性、规则性业务流程的技术
1.2 RPA作用及使用场景
# 功能作用
# 1 模拟人类操作:可自动完成点击、输入、复制、粘贴、数据提取、文件处理等操作。
# 2 基于规则驱动:需要明确的业务规则,当流程逻辑固定、输入输出可预期时,RPA 能高效运行。
# 3 非侵入式集成:无需改造现有 IT 系统(如 ERP、CRM、网页平台等),通过界面交互实现自动化,降低实施难度。
# 4 提升效率与准确性:替代人工完成重复性工作,减少人为错误,同时可 7×24 小时不间断运行。
# 常见应用场景包括:
财务对账、发票处理、数据录入与迁移、报表生成、客服信息查询、供应链订单处理等
1.3 目前主流的RPA工具
### 1 国外软件产品
UiPath
全球市场份额领先的 RPA 工具,功能全面,支持可视化流程设计(拖拽式操作),适合复杂流程自动化。提供丰富的预置活动库(如 Excel、数据库、网页操作等),支持 AI 集成(如 OCR、自然语言处理),社区版免费供个人学习使用,企业版适合大型组织部署。
Automation Anywhere
另一国际巨头,以 “云原生” 为特色,支持云端部署和管理机器人,适合分布式团队协作。提供 “智商机器人”(IQ Bot),集成 AI 能力处理非结构化数据(如扫描件、手写体),适合需要智能处理的场景。
Blue Prism
较早进入 RPA 领域的工具,以 “企业级稳定性” 著称,严格遵循 IT 治理标准,适合对合规性、安全性要求高的行业(如金融、医疗)。流程设计更偏向代码逻辑,学习门槛稍高,多应用于大型企业核心业务流程。
### 2 国内软件产品
影刀 RPA(Yingdao)
国内市场表现突出的 RPA 工具,主打 “简单易用”,界面友好,适合无编程基础的用户快速上手。支持 Windows、网页、移动端应用自动化,集成了 OCR、API 调用等功能,在电商、零售、互联网行业应用广泛,提供免费版和企业版。
实在 RPA:AI能力是独一档的存在,开创 “RPA + 大模型” 模式——第三代RPA数字员工,在非结构化数据处理方面表现出色。实在 RPA 提供了高度定制化服务,其智能体(实在Agent)可自训练优化,能更好地适应复杂多变的业务场景。
八爪鱼 RPA:以简单易用、功能强大著称,提供了丰富的模板和组件,用户可通过拖拽式操作快速搭建自动化流程。八爪鱼 RPA 在电商、数据采集等领域应用广泛
来也科技(laiye)
结合 RPA 与 AI 能力(如对话机器人),形成 “RPA+AI” 解决方案。工具支持流程录制、可视化设计,适合政务、金融、制造业等场景,提供针对不同行业的预置模板,降低实施成本。
艺赛旗(IS-RPA)
国内较早自主研发的 RPA 工具,支持复杂流程自动化和大规模机器人管理,强调与企业现有系统的集成能力,在能源、物流等行业有较多案例。
## 3 开源框架--》python操作比较多
Robot Framework:免费且灵活,具有强大的可扩展性和丰富的库支持。它采用关键字驱动的测试框架,易于学习和维护,适合小型团队和个人开发者进行自动化测试和流程自动化。
OpenRPA:社区活跃,提供了跨平台的自动化解决方案。OpenRPA 支持多种编程语言,能够与现有系统无缝集成,为开发者提供了广阔的创新空间。
# 如果我们选择使用RPA的软件
-影刀RPA:只能使用win机器,mac机器是阉割版
# 如果你是用代码写的自动化流程
-跟机器无关
# 我们学习的是软件的操作,不太设计到代码的编写
1.4 代码演示RPA
# pip install rpaframework
from RPA.Browser.Selenium import Selenium
import time
class DouyinAutoScroller:
def __init__(self):
self.browser = Selenium()
def open_douyin(self):
"""打开网页版抖音"""
print("打开网页版抖音")
self.browser.open_available_browser("https://www.douyin.com/")
self.browser.maximize_browser_window()
# 等待页面加载
print("等待页面加载...")
time.sleep(10) # 初始等待时间,确保页面完全加载
def run(self):
"""运行自动化流程"""
try:
print("===== 开始自动刷抖音流程 =====")
self.open_douyin()
print("===== 自动刷抖音流程完成 =====")
except Exception as e:
print(f"执行过程中发生严重错误: {str(e)}")
raise
finally:
# 关闭浏览器
self.browser.close_all_browsers()
if __name__ == "__main__":
bot = DouyinAutoScroller()
bot.run()
2 影刀RPA安装-注册-启动
# 1 下载软件,安装到电脑上---》不需要写代码
-https://www.yingdao.com/product/
-只有win版,功能才全,mac是阉割版
-专业版是收费的,我们使用的是免费功能---》后期可能免费功能也会收费
# 2 安装
# 3 桌面双击打开
# 4 注册完账号
# 5 登录进去
3 抖音评论获取并写入到excel
# 0 影刀RPA可以
-操作web :网页,网站
-操作PC:电脑:百度网盘,微信
-操作手机:美团外卖
# 1 目标:
获取抖音某个视频下的评论---》把评论人;评论内容;评论时间---》写入到excel中
# 2 步骤
## 2.1 新建PC应用
## 2.2 打开网页
-可以搜索:
-可以拖拽过来
-如果是第一次:需要装个影刀的浏览器插件
-https://www.yingdao.com/yddoc/rpa/710821364073103360
## 2.3 等待元素加载
-因为每个操作完,都会有默认的等待时间,所以一般我们不设置等待
-如果大家担心自动化操作速度太快,被网站判断为恶意行为--》我们设置一下等待2s或ns
## 2.4 键盘输入
-输入 x
-输入x 可以打开评论区
## 3.5 获取元素对象 --》评论区元素
-选择新元素---》ctrl+评论区整块
-点编辑:选择 data-e2e='comment_list'
## 3.6 启动一个循环,多滑动几次 10次[自行决定]
## 3.7 鼠标滚动网页
## 3.8 批量数据获取
-选三列:人名;评论内容;评论时间
## 3.9 打印了数据
## 3.10 新建excel
## 3.11 循环上面批量获取的数据---》一行行的写入到excel中
-循环列表:上面的 table_data---》循环的每一个给了loop_item
## 3.12 在循环中,写入excel表格
-按行写
-追加1行
-写入内容使用python:[loop_item[0],loop_item[1],loop_item[2]]
## 3.13 运行看效果
2.1 安装谷歌插件
# 详见:https://www.yingdao.com/yddoc/rpa/710821364073103360
2.3 选择器类型
# 1 默认:简单,但是有的选不出来
# 2 css 下面俩更高级
# 3 xpath
4 手机app操作--美团外卖特价商品数据抓取
手机app操作,还不是很完善
只支持安卓手机;ios手机目前不可以
其他操作不如web或桌面好用
4.1 电脑端安装驱动
# 1 安装手机插件
# 2 如果驱动装不了,大家可以自行搜索
-原理:安装 adb,使用appnium操作手机
4.2 手机开启调试模式
输入手机型号,搜索,如何开启调试模式
用根好数据线:有的线可以充电,但是不能调试
一头插电脑,一头插手机
手机管理:看到你的手机了---》点击链接--》显示手机屏幕即可
4.3 抓取美团外卖特价商品
把美团外卖app,安装到手机
# 1 链接手机
-选中你的手机即可
# 2 打开手机app
-获取包名
# 3 选择 美食 元素点击
# 4 选择 搜索框 点击
# 5 输入文本
-光标闪烁位置
-输入文字:奶茶
-输入后回车
# 6 点击特价
# 7 for循环 5次
# 7.1 for循环中
-循环相似元素--》默认选择方式---》获取文本元素---》打印出所有奶茶名字
-循环相似元素--》xpath选择--》//*[starts-with(@text,"¥")][2]--》获取文本元素
-滑动屏幕
# 9 补充:如果 使用默认选择方式选不中--》就要用xpath了--》需要会xpath 语法
# 10 补充:如果想拿原价:需要全拿出来后拼接--》比较复杂
第1位数字://*[starts-with(@text,"¥")][2]/preceding-sibling::*[3]
第2位是个点://*[starts-with(@text,"¥")][2]/preceding-sibling::*[2]
第3位数字://*[starts-with(@text,"¥")][2]/preceding-sibling::*[1]