会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
赖荣生
博客园
首页
新随笔
联系
订阅
管理
2026年4月16日
四、慢读源码 - PageEyes agent
摘要: 一、PageEyes 目录结构图 如果想学习源码主要精力放在核心代码即可。 二、核心逻辑 1、PlanningAgent 分解指令为步骤序列 调用 PlanningAgent 的位置 调用后 planning_steps 保存的就是步骤序列,内容如下: 输入 - 打开 url "https://yo
阅读全文
posted @ 2026-04-16 11:12 rslai
阅读(12)
评论(0)
推荐(0)
2026年4月10日
三、源码运行 PageEyes agent
摘要: 一、克隆 PageEyes 并安装依赖 # 激活 py312 环境 conda activate py312 # 克隆项目源码 git clone https://github.com/tencentmusic/page-eyes-agent.git # 进入 page-eyes-agent cd
阅读全文
posted @ 2026-04-10 11:40 rslai
阅读(16)
评论(0)
推荐(0)
2026年4月7日
OmniParser - 改为 REST API 调用(二)
摘要: 上一章( OmniParser - 安装 linux 系统(一) )讲的是如何安装以及运行 gradio_demo.py,启动一个 web 应用,如下图。这一章的内容是如何启动一个 REST API 服务,通过接口来提供服务。 一、服务端代码 在 gradio_demo.py 同一个目录中添加 ma
阅读全文
posted @ 2026-04-07 08:25 rslai
阅读(16)
评论(0)
推荐(0)
2026年3月26日
OmniParser - 安装 linux 系统(一)
摘要: 一、安装 Ubuntu 访问 https://cn.ubuntu.com/download 网站下载 乌班图 系统。我下载的是 24.04 LTS 版本,如下图。跟着提示全部安装即可,注意要安装 SSH 服务。 二、安装 python 虚拟环境 ssh 登陆服务器后,执行一下命令安装 minicon
阅读全文
posted @ 2026-03-26 13:44 rslai
阅读(69)
评论(0)
推荐(0)
2026年3月17日
二、安装 PageEyes Agent
摘要: 一、Python 环境 需要 Python 3.12 或更高版本。(我用的 3.13 运行会报 No module named 'imghdr'。查后 imghdr 在 3.13 中废弃了) 我用的 conda 虚拟环境,版本检查命令如下: conda create -n py312 python=
阅读全文
posted @ 2026-03-17 15:49 rslai
阅读(41)
评论(0)
推荐(0)
一、PageEyes Agent 简介
摘要: PageEyes Agent 是一个自动化 Agent 框架,可以实现用自然语言完成跨平台 UI 自动化测试、巡检和业务验证。 特点: PageEyes Agent 以 自然语言指令 颠覆传统 UI 自动化:无需编写脚本,也能实现复杂的跨平台测试与巡检。 基于 Pydantic AI 框架开发 其中
阅读全文
posted @ 2026-03-17 15:20 rslai
阅读(73)
评论(0)
推荐(0)
2025年10月28日
LangGraph & MCP - 使用LangGraph实现多智能体架构(七)
摘要: 在 LangChain 体系中,LangChain 主要集成了和大语言模型交互的能力,而 LangGraph 主要实现了复杂的流程调度。将这两个能力结合起来,就可以实现一个复杂的多智能体。 一、多智能体典型的组装方式 https://langchain-ai.github.io/langgraph/
阅读全文
posted @ 2025-10-28 14:51 rslai
阅读(559)
评论(0)
推荐(0)
LangGraph & MCP - 使用LangGraph构建多智能体工作流(六)
摘要: 一、流式输出大模型调用结果 之前提到 Graph 的流式输出有几种不同的模式,这里展示 messages 模式,是用来监控大语言模型的 Token 记录的。 代码在 stream_mode_messages.py 文件中,内容如下: # -*- coding: utf-8 -*- import os
阅读全文
posted @ 2025-10-28 14:45 rslai
阅读(335)
评论(0)
推荐(0)
LangGraph & MCP - Graph(五)
摘要: Graph 是 LangGraph 的核心,它以有向无环图的方式来整合多个 Agent,构建更复杂的 Agent 大模型应用,形成更复杂的工作流。并且提供了很多产品级的特性,保证这些应用可以更稳定高效的执行。 Graph 主要包含三个基本元素: State:在整个应用中共享的一种数据结构 Node:
阅读全文
posted @ 2025-10-28 14:43 rslai
阅读(263)
评论(0)
推荐(0)
LangGraph & MCP - 使用 LangGraph构建单独的 Agent(四)
摘要: 一、什么是 Agent ? Agent 是 LangGraph 中的一个核心概念。LangGraph 中 Agent 封装了访问大模型、调用 Tools、保存 ChatMemory 等等这些基础能力。可以完成一系列基于大模型构建的任务。同时,又可以随时干预 Agent 执行进度,对关键步骤随时做出调
阅读全文
posted @ 2025-10-28 14:34 rslai
阅读(338)
评论(0)
推荐(0)
下一页
公告