Proxy-lite:轻量级、开源权重的自主助手项目

Proxy Lite :如果要在本地部署后使用,服务运行后的端点地址为http://localhost:8008/v1。此外,Proxy Lite 默认连接的 。 Convergence AI 开源的一个轻量(mini)版本的代理 / 助手框架。它可以让模型在一个环境中,自主地使用工具 (如浏览器、点击、搜索) 来完成任务。

一、项目简介

  • 名称:proxy-lite — “A mini, open-weights, version of our Proxy assistant.”
  • 它是 Proxy 助手的轻量、开源版本(权重开放)。
  • 目标是做一个“自主代理”(autonomous agent):用户发一个高层任务(例如“帮我查一下某地附近的餐厅并评价”),代理自己去调用工具、浏览器、分析结果、做出动作,最终把结果反馈回来。

二、关键组成 & 运行机制

下面是 proxy-lite 的核心组成部分和工作流程:

模块 / 组件功能 / 作用
Runner & RunnerConfig在 Python 中启动代理的主逻辑,配置环境、策略、模型、工具等。
环境 (environment)比如 “webbrowser” 环境:代理可以在浏览器中操作(点击、输入、跳转等)。
工具 (Tools)代理在环境中可用的动作,比如 BrowserToolReturnValueTool 等。
模型 / 客户端 (client, model_id, api_base)负责具体语言推理、计划、工具调用等。可以调用远端 API 或者本地服务。
消息历史 (message_history)结构化的对话 / 观察历史,用来给模型上下文。
工具调用 (tool_call)模型输出指令形式的调用,如 “click”、“type” 等,代理执行后继续交互。

运行流程大致是:

  1. 用户给出一个任务(高层意图)
  2. Runner 把任务包装进消息历史
  3. 模型基于当前观察 + 历史 + 可用工具,生成下一步“思考 + 工具调用”
  4. 环境 / 工具模块执行工具调用(例如浏览器点击、搜索、获取页面内容)
  5. 把观察结果反馈回来,再由模型决定下一步
  6. 重复以上步骤,直到任务完成或超时

在模型响应里,会有 <observation> … </observation><thinking> … </thinking><tool_call> … </tool_call> 这样的结构来区分 “观察 / 推理 / 行动” 三部分。

三、如何使用 / 部署

下面是一些使用步骤和部署建议:

  • 本地运行 / 安装
    • 克隆仓库
    • 使用 make proxy(项目提供的脚本),或者手动用 pip / 虚拟环境安装
    • 安装 Playwright(用于浏览器操作)
  • 调用 / 使用
    • 可以在命令行执行类似 proxy "Find some markets near Kings Cross and tell me their ratings." 这样的任务
    • 也可以启一个本地网页界面 (web UI) 来做交互式演示
    • 或在 Python 里,通过 Runner 类 + RunnerConfig 构造,作为库调用
  • 模型 / 接口
    • 默认 proxy-lite 指向一个 HuggingFace Spaces 上的演示端点(不适合高压使用)
    • 推荐用户自己部署模型端点,比如用 vLLM 去 serve convergence-ai/proxy-lite-3b 模型,并开启工具调用解析器 --tool-call-parser hermes 等参数
    • 部署后,在客户端通过 --api-base 或 PROXY_LITE_API_BASE 指定你的端点地址

四、优点 & 应用场景

优点 / 价值

  • 自主执行能力:给定高层目标后,代理可以自己调用工具、浏览器、搜索、点击等来完成中间步骤
  • 可扩展 / 模块化:环境、工具、模型可以替换或扩展,适配不同任务
  • 开源 & 权重开放:相比那些完全闭源的大模型系统,这让社区能更自由地实验
  • 轻量 / 相对简化:虽然是简化版本,不一定具备所有 Proxy 全功能,但足够满足很多代理型任务的原型探索

应用场景

  • Web 自动化任务(如 “帮我查某地” + 自动抓取、排序、比较)
  • 智能助理 / 代理式任务(不只是问答,而是行动 + 执行)
  • 研究与原型验证:希望在开放环境下测试代理智能、工具调用能力
  • 装配到更复杂系统里作为子模块

五、局限 / 注意事项

项目也有一些限制和挑战:

  • 性能 / 稳定性:默认演示端点是为演示设计,不适合高负载或生产使用
  • 反机器人 / 防爬虫挑战:浏览器自动操作可能会被网站检测或被封 / 出现 Captcha 问题
  • 安全 / 隐私:自动代理有可能访问敏感页面、提交表单等,需要用户对授权、凭证、小心控制
  • 任务复杂性限制:对极其复杂、需要很多条件判断 / 用户交互的任务,proxy-lite 可能难以胜任
  • 模型能力瓶颈:作为轻量版本,在推理智能、工具调用判断能力、理解复杂上下文等方面可能不如更旗舰版本的代理系统

Hugging Face Spaces 的演示端点:https://convergence-ai-demo-api.hf.space/v1
GitHub :https://github.com/convergence-ai/proxy-lite

油管:https://youtu.be/BHGAFXZFZoU