Proxy Lite :如果要在本地部署后使用,服务运行后的端点地址为http://localhost:8008/v1。此外,Proxy Lite 默认连接的 。 Convergence AI 开源的一个轻量(mini)版本的代理 / 助手框架。它可以让模型在一个环境中,自主地使用工具 (如浏览器、点击、搜索) 来完成任务。
一、项目简介
- 名称:proxy-lite — “A mini, open-weights, version of our Proxy assistant.”
- 它是 Proxy 助手的轻量、开源版本(权重开放)。
- 目标是做一个“自主代理”(autonomous agent):用户发一个高层任务(例如“帮我查一下某地附近的餐厅并评价”),代理自己去调用工具、浏览器、分析结果、做出动作,最终把结果反馈回来。
二、关键组成 & 运行机制
下面是 proxy-lite 的核心组成部分和工作流程:
| 模块 / 组件 | 功能 / 作用 |
|---|---|
| Runner & RunnerConfig | 在 Python 中启动代理的主逻辑,配置环境、策略、模型、工具等。 |
| 环境 (environment) | 比如 “webbrowser” 环境:代理可以在浏览器中操作(点击、输入、跳转等)。 |
| 工具 (Tools) | 代理在环境中可用的动作,比如 BrowserTool、ReturnValueTool 等。 |
| 模型 / 客户端 (client, model_id, api_base) | 负责具体语言推理、计划、工具调用等。可以调用远端 API 或者本地服务。 |
| 消息历史 (message_history) | 结构化的对话 / 观察历史,用来给模型上下文。 |
| 工具调用 (tool_call) | 模型输出指令形式的调用,如 “click”、“type” 等,代理执行后继续交互。 |
运行流程大致是:
- 用户给出一个任务(高层意图)
- Runner 把任务包装进消息历史
- 模型基于当前观察 + 历史 + 可用工具,生成下一步“思考 + 工具调用”
- 环境 / 工具模块执行工具调用(例如浏览器点击、搜索、获取页面内容)
- 把观察结果反馈回来,再由模型决定下一步
- 重复以上步骤,直到任务完成或超时
在模型响应里,会有 <observation> … </observation>、<thinking> … </thinking>、<tool_call> … </tool_call> 这样的结构来区分 “观察 / 推理 / 行动” 三部分。
三、如何使用 / 部署
下面是一些使用步骤和部署建议:
- 本地运行 / 安装
- 克隆仓库
- 使用
make proxy(项目提供的脚本),或者手动用 pip / 虚拟环境安装 - 安装 Playwright(用于浏览器操作)
- 调用 / 使用
- 可以在命令行执行类似
proxy "Find some markets near Kings Cross and tell me their ratings."这样的任务 - 也可以启一个本地网页界面 (web UI) 来做交互式演示
- 或在 Python 里,通过
Runner类 +RunnerConfig构造,作为库调用
- 可以在命令行执行类似
- 模型 / 接口
- 默认 proxy-lite 指向一个 HuggingFace Spaces 上的演示端点(不适合高压使用)
- 推荐用户自己部署模型端点,比如用 vLLM 去 serve
convergence-ai/proxy-lite-3b模型,并开启工具调用解析器--tool-call-parser hermes等参数 - 部署后,在客户端通过
--api-base或PROXY_LITE_API_BASE指定你的端点地址
四、优点 & 应用场景
优点 / 价值:
- 自主执行能力:给定高层目标后,代理可以自己调用工具、浏览器、搜索、点击等来完成中间步骤
- 可扩展 / 模块化:环境、工具、模型可以替换或扩展,适配不同任务
- 开源 & 权重开放:相比那些完全闭源的大模型系统,这让社区能更自由地实验
- 轻量 / 相对简化:虽然是简化版本,不一定具备所有 Proxy 全功能,但足够满足很多代理型任务的原型探索
应用场景:
- Web 自动化任务(如 “帮我查某地” + 自动抓取、排序、比较)
- 智能助理 / 代理式任务(不只是问答,而是行动 + 执行)
- 研究与原型验证:希望在开放环境下测试代理智能、工具调用能力
- 装配到更复杂系统里作为子模块
五、局限 / 注意事项
项目也有一些限制和挑战:
- 性能 / 稳定性:默认演示端点是为演示设计,不适合高负载或生产使用
- 反机器人 / 防爬虫挑战:浏览器自动操作可能会被网站检测或被封 / 出现 Captcha 问题
- 安全 / 隐私:自动代理有可能访问敏感页面、提交表单等,需要用户对授权、凭证、小心控制
- 任务复杂性限制:对极其复杂、需要很多条件判断 / 用户交互的任务,proxy-lite 可能难以胜任
- 模型能力瓶颈:作为轻量版本,在推理智能、工具调用判断能力、理解复杂上下文等方面可能不如更旗舰版本的代理系统
Hugging Face Spaces 的演示端点:https://convergence-ai-demo-api.hf.space/v1
GitHub :https://github.com/convergence-ai/proxy-lite