Octopus-v2:可以在移动设备上运行的2B LLMs

Octopus-V2-2B是由斯坦福大学Nexa AI开发专为Android API的功能调用定制。
采用了一种独特的功能性标记策略,超越了基于RAG的方法,特别适用于边缘计算设备。
比Llama7B + RAG方案快36倍,性能优于 GPT-4,延迟时间小于 1 秒。
它能够在移动设备上直接运行,支持广泛的应用场景,从而推动Android系统管理和设备间协同工作的新方式。
其快速和高效的推理能力,特别适合需要高性能和精确功能调用的场景,如智能家居控制、移动应用开发等。
🔑 特殊标记将错误率降至最低:为每个函数分配一个唯一的标记,大大降低了函数选择的错误率。缩短了 95% 以上的上下文。

✅ 卓越的准确性:每个函数只需 100 个样本,准确率就达到了惊人的 98.095%。
⚡ 响应时间缩短:与基于 RAG 函数调用的 Llama-7B 相比,我们的方法将延迟时间缩短了 35 倍。
⏱️ 典型查询在 1.1 至 1.7 秒内即可在设备上运行。它可以部署在汽车、耳机、手机、电脑等设备上...
💸 实际应用:可以改造移动智能设备,实现与地图和送餐等各种服务的无缝互动。

论文:https://arxiv.org/abs/2404.01744
模型下载:https://huggingface.co/NexaAIDev/Octopus-v2

视频:https://youtu.be/XtEkiSslGHY

了解 Tarogo Cloud Bloger & Shop 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读