Proxy-lite：轻量级、开源权重的自主助手项目

Watch this video on YouTube

Proxy Lite ：如果要在本地部署后使用，服务运行后的端点地址为http://localhost:8008/v1。此外，Proxy Lite 默认连接的。 Convergence AI 开源的一个轻量（mini）版本的代理 / 助手框架。它可以让模型在一个环境中，自主地使用工具 (如浏览器、点击、搜索) 来完成任务。

一、项目简介

名称：proxy-lite — “A mini, open-weights, version of our Proxy assistant.”
它是 Proxy 助手的轻量、开源版本（权重开放）。
目标是做一个“自主代理”（autonomous agent）：用户发一个高层任务（例如“帮我查一下某地附近的餐厅并评价”），代理自己去调用工具、浏览器、分析结果、做出动作，最终把结果反馈回来。

二、关键组成 & 运行机制

下面是 proxy-lite 的核心组成部分和工作流程：

模块 / 组件	功能 / 作用
Runner & RunnerConfig	在 Python 中启动代理的主逻辑，配置环境、策略、模型、工具等。
环境 (environment)	比如 “webbrowser” 环境：代理可以在浏览器中操作（点击、输入、跳转等）。
工具 (Tools)	代理在环境中可用的动作，比如 `BrowserTool`、`ReturnValueTool` 等。
模型 / 客户端 (client, model_id, api_base)	负责具体语言推理、计划、工具调用等。可以调用远端 API 或者本地服务。
消息历史 (message_history)	结构化的对话 / 观察历史，用来给模型上下文。
工具调用 (tool_call)	模型输出指令形式的调用，如 “click”、“type” 等，代理执行后继续交互。

运行流程大致是：

用户给出一个任务（高层意图）
Runner 把任务包装进消息历史
模型基于当前观察 + 历史 + 可用工具，生成下一步“思考 + 工具调用”
环境 / 工具模块执行工具调用（例如浏览器点击、搜索、获取页面内容）
把观察结果反馈回来，再由模型决定下一步
重复以上步骤，直到任务完成或超时

在模型响应里，会有 <observation> … </observation>、<thinking> … </thinking>、<tool_call> … </tool_call> 这样的结构来区分 “观察 / 推理 / 行动” 三部分。

三、如何使用 / 部署

下面是一些使用步骤和部署建议：

本地运行 / 安装
- 克隆仓库
- 使用 make proxy（项目提供的脚本），或者手动用 pip / 虚拟环境安装
- 安装 Playwright（用于浏览器操作）
调用 / 使用
- 可以在命令行执行类似 proxy "Find some markets near Kings Cross and tell me their ratings." 这样的任务
- 也可以启一个本地网页界面 (web UI) 来做交互式演示
- 或在 Python 里，通过 Runner 类 + RunnerConfig 构造，作为库调用
模型 / 接口
- 默认 proxy-lite 指向一个 HuggingFace Spaces 上的演示端点（不适合高压使用）
- 推荐用户自己部署模型端点，比如用 vLLM 去 serve convergence-ai/proxy-lite-3b 模型，并开启工具调用解析器 --tool-call-parser hermes 等参数
- 部署后，在客户端通过 --api-base 或 PROXY_LITE_API_BASE 指定你的端点地址

四、优点 & 应用场景

优点 / 价值：

自主执行能力：给定高层目标后，代理可以自己调用工具、浏览器、搜索、点击等来完成中间步骤
可扩展 / 模块化：环境、工具、模型可以替换或扩展，适配不同任务
开源 & 权重开放：相比那些完全闭源的大模型系统，这让社区能更自由地实验
轻量 / 相对简化：虽然是简化版本，不一定具备所有 Proxy 全功能，但足够满足很多代理型任务的原型探索

应用场景：

Web 自动化任务（如 “帮我查某地” + 自动抓取、排序、比较）
智能助理 / 代理式任务（不只是问答，而是行动 + 执行）
研究与原型验证：希望在开放环境下测试代理智能、工具调用能力
装配到更复杂系统里作为子模块

五、局限 / 注意事项

项目也有一些限制和挑战：

性能 / 稳定性：默认演示端点是为演示设计，不适合高负载或生产使用
反机器人 / 防爬虫挑战：浏览器自动操作可能会被网站检测或被封 / 出现 Captcha 问题
安全 / 隐私：自动代理有可能访问敏感页面、提交表单等，需要用户对授权、凭证、小心控制
任务复杂性限制：对极其复杂、需要很多条件判断 / 用户交互的任务，proxy-lite 可能难以胜任
模型能力瓶颈：作为轻量版本，在推理智能、工具调用判断能力、理解复杂上下文等方面可能不如更旗舰版本的代理系统

Hugging Face Spaces 的演示端点：https://convergence-ai-demo-api.hf.space/v1
GitHub ：https://github.com/convergence-ai/proxy-lite

油管：https://youtu.be/BHGAFXZFZoU

Proxy-lite：轻量级、开源权重的自主助手项目

一、项目简介

二、关键组成 & 运行机制

三、如何使用 / 部署

四、优点 & 应用场景

五、局限 / 注意事项

多模态联合，实现高质量的视频到音频合成

定格：研究人員開發出世界上最快的顯微鏡，可以看到運動中的電子

ChatGPT 语音朗读功能开始灰度测试

AI 研究在秘鲁纳斯卡沙漠发现了300幅古代蚀刻画

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email

一、项目简介

二、关键组成 & 运行机制

三、如何使用 / 部署

四、优点 & 应用场景

五、局限 / 注意事项

分享此文：

多模态联合，实现高质量的视频到音频合成

定格：研究人員開發出世界上最快的顯微鏡，可以看到運動中的電子

ChatGPT 语音朗读功能开始灰度测试

AI 研究在秘鲁纳斯卡沙漠发现了300幅古代蚀刻画

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email