开源用于软件工程任务的代码生成模型

https://youtu.be/NLFRilWNNbA

这个项目 Kimi‑Dev 是 Moonshot AI 发布的一个开源「编程方向的大型语言模型」(Coding LLM),旨在用于自动修复代码和编写测试。它的最新模型为 Kimi‑Dev‑72B(约 727 亿参数),在开源领域的 SWE‑bench Verified 基准上取得 60.4% 的通过率,达到了目前最佳的开源模型表现

🚀 核心亮点

  • 双子框架:BugFixer + TestWriter
    • BugFixer 定位出错文件并修复代码
    • TestWriter 编写单元测试,生成失败再通过的测试用例
      两者配合确保修复完整且可验证
  • 中期训练 + 强化学习 (RL)
    • 使用接近 1500 亿 token 以上的真实 GitHub issues/PR 的训练数据来增强模型代码理解和定位能力
    • 采用 “测试通过即奖励” 的 RL 策略,模型实际在 Docker 环境中运行测试,只有测试全部通过才给予奖励 。
  • 测试时自我对抗机制 (Self-Play)
    • BugFixer 与 TestWriter 在推理阶段互相“自对弈”,生成多候选补丁和测试,最终选择最佳结果

📦 使用方式

  1. Clone 仓库并安装环境:git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev python=3.12 pip install -e .
  2. 安装 vLLM(支持 CUDA 12.8),并启动推理服务:pip install vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi‑Dev‑72B --served-model-name kimi-dev ...
  3. 使用项目提供的脚本运行:
    • rollout_messages_bugfixer.py 用于自动修复
    • rollout_messages_testwriter.py 用于生成测试
  4. 模型权重与 Demo 可在 Hugging Face 获得

📈 基准成绩与背景

  • 在 SWE‑bench Verified 上达到了 60.4% 的问题解决率,高出其他同类模型。
  • 项目代码、模型和使用文档已发布于 GitHub 和 Hugging Face,采用 MIT 许可证开源 。
  • Moonshot AI 是一家成立于 2023 年的中国 AI 公司,定位于开发高性能、多模态、大上下文能力的 LLM,旗下还有 Kimi‑k1.5/Kimi‑VL/Kimi‑Audio 等系列 。

🧠 总结

Kimi‑Dev 是一个功能强大的开源编程方向 LLM,专注于自动化代码修复和单元测试生成,并在相关任务上取得了开源最好成绩。如果你的需求是:

  • 自动修复项目 bug
  • 为项目生成或补充测试
  • 研究 AI 在软件工程中的落地应用

那么这个项目非常值得深入研究。你可以进一步查看其 README、代码结构、示例脚本(比如 kimidev/ 文件夹),或者部署 Demo 上手体验。

Github:https://github.com/MoonshotAI/Kimi-Dev

油管:https://youtu.be/NLFRilWNNbA

滚动至顶部