Pain · 传统 RPA 的问题
脚本能跑通,但跑不久
01
脚本脆弱易坏
传统 RPA 绑定固定选择器,前端一改版,第二天脚本就失效。
02
维护成本高
界面、流程一变就要人工重写脚本,长期维护吞掉大量人力。
03
只会照搬,不会变通
脚本只能跑死流程,遇到异常与新情况无法自己判断、自己修。
Solution · 自进化方案
一次教会,之后越用越快
首次靠大模型推理走通任务,之后复用走过的路径——重复工作接近脚本速度,界面变化还能自愈。
- 1
首次执行靠大模型推理走通任务,理解界面意图而非死记坐标。
- 2
把走过的路径与决策记录为工作流缓存,重复任务直接复用。
- 3
重复任务从第二次起复用缓存,速度接近脚本,10–100× 提速、模型成本下降。
- 4
界面变化时,自愈选择器在 a11y 树与视觉中找语义等价元素,继续把活做完。
执行成本 × 次数 · Cost per run越用越快
Run 1
首次执行
LLM 推理走通任务,较慢
Run 2
第 2 次
缓存命中,复用路径
Run N
第 N 次
接近脚本速度,10–100× 提速
示意 · 取决于任务复杂度
Capabilities · 关键能力
为什么它不会一改版就坏
自愈选择器
Self-Healing Selectors
界面改版后,在 a11y 树与视觉里找语义等价元素——按钮改名、节点挪位也能继续执行,无需重写脚本。
工作流缓存 · 越用越快
Workflow Caching
首次靠 LLM 推理走通,之后复用缓存路径。重复任务 10–100× 提速,模型成本随之下降。
双通道页面理解
Dual-Channel Understanding
同时读 a11y 树与视觉截图,两条通道交叉验证,不被复杂前端框架骗到。
人工审批门
Human Approval Gates
高风险动作(提交、付款、删除)先暂停,经 IM 推送人工放行后再继续,超时归档。
Rollout · 上手流程
上线 → 学习 → 提速
01
上线
用自然语言描述任务,Agent 当天即可在浏览器中跑通。
02
学习
走过的路径与决策沉淀为工作流缓存,越跑越熟。
03
提速
重复任务复用缓存,速度接近脚本;界面变化自愈、无需维护。