这个项目 Kimi‑Dev 是 Moonshot AI 发布的一个开源「编程方向的大型语言模型」(Coding LLM),旨在用于自动修复代码和编写测试。它的最新模型为 Kimi‑Dev‑72B(约 727 亿参数),在开源领域的 SWE‑bench Verified 基准上取得 60.4% 的通过率,达到了目前最佳的开源模型表现
🚀 核心亮点
- 双子框架:BugFixer + TestWriter
- BugFixer 定位出错文件并修复代码
- TestWriter 编写单元测试,生成失败再通过的测试用例
两者配合确保修复完整且可验证
- 中期训练 + 强化学习 (RL)
- 使用接近 1500 亿 token 以上的真实 GitHub issues/PR 的训练数据来增强模型代码理解和定位能力
- 采用 “测试通过即奖励” 的 RL 策略,模型实际在 Docker 环境中运行测试,只有测试全部通过才给予奖励 。
- 测试时自我对抗机制 (Self-Play)
- BugFixer 与 TestWriter 在推理阶段互相“自对弈”,生成多候选补丁和测试,最终选择最佳结果
📦 使用方式
- Clone 仓库并安装环境:
git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev python=3.12 pip install -e .
- 安装 vLLM(支持 CUDA 12.8),并启动推理服务:
pip install vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi‑Dev‑72B --served-model-name kimi-dev ...
- 使用项目提供的脚本运行:
rollout_messages_bugfixer.py
用于自动修复rollout_messages_testwriter.py
用于生成测试
- 模型权重与 Demo 可在 Hugging Face 获得
📈 基准成绩与背景
- 在 SWE‑bench Verified 上达到了 60.4% 的问题解决率,高出其他同类模型。
- 项目代码、模型和使用文档已发布于 GitHub 和 Hugging Face,采用 MIT 许可证开源 。
- Moonshot AI 是一家成立于 2023 年的中国 AI 公司,定位于开发高性能、多模态、大上下文能力的 LLM,旗下还有 Kimi‑k1.5/Kimi‑VL/Kimi‑Audio 等系列 。
🧠 总结
Kimi‑Dev 是一个功能强大的开源编程方向 LLM,专注于自动化代码修复和单元测试生成,并在相关任务上取得了开源最好成绩。如果你的需求是:
- 自动修复项目 bug
- 为项目生成或补充测试
- 研究 AI 在软件工程中的落地应用
那么这个项目非常值得深入研究。你可以进一步查看其 README、代码结构、示例脚本(比如 kimidev/
文件夹),或者部署 Demo 上手体验。