新版Claude 3.5 Sonnet将可进行电脑操作
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。
Claude API 还将支持电脑操作,并已进入公共测试阶段。
AI news tracing site
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。
Claude API 还将支持电脑操作,并已进入公共测试阶段。
允许模型与外部系统和数据进行交互
使用Tool use (function calling)功能,Claude不仅能够生成文本或回答问题,还能实际调用外部定义的函数或工具来执行特定操作,如获取当前的天气信息、执行数学计算等。
Anthropic太牛了。Claude-3 发布的两件事:
领域专家基准。我对饱和的 MMLU 和 HumanEval 不那么感兴趣。Claude特别挑选了金融、医学和哲学作为专家领域并报告性能。我建议所有 LLM 模型卡都遵循这一点,这样不同的下游应用程序就会知道该期待什么。
拒绝率分析。LLMs’对无辜问题过于谨慎的回答正在成为一种流行病。Anthropic 通常处于极端安全的一端,但他们认识到了这个问题,并强调了他们在这方面的努力。好极了!