开源用于软件工程任务的代码生成模型

Watch this video on YouTube

这个项目 Kimi‑Dev 是 Moonshot AI 发布的一个开源「编程方向的大型语言模型」(Coding LLM)，旨在用于自动修复代码和编写测试。它的最新模型为 Kimi‑Dev‑72B（约 727 亿参数），在开源领域的 SWE‑bench Verified 基准上取得 60.4% 的通过率，达到了目前最佳的开源模型表现

🚀 核心亮点

双子框架：BugFixer + TestWriter
- BugFixer 定位出错文件并修复代码
- TestWriter 编写单元测试，生成失败再通过的测试用例
  两者配合确保修复完整且可验证
中期训练 + 强化学习 (RL)
- 使用接近 1500 亿 token 以上的真实 GitHub issues/PR 的训练数据来增强模型代码理解和定位能力
- 采用 “测试通过即奖励” 的 RL 策略，模型实际在 Docker 环境中运行测试，只有测试全部通过才给予奖励。
测试时自我对抗机制 (Self-Play)
- BugFixer 与 TestWriter 在推理阶段互相“自对弈”，生成多候选补丁和测试，最终选择最佳结果

📦 使用方式

Clone 仓库并安装环境：git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev python=3.12 pip install -e .
安装 vLLM（支持 CUDA 12.8），并启动推理服务：pip install vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi‑Dev‑72B --served-model-name kimi-dev ...
使用项目提供的脚本运行：
- rollout_messages_bugfixer.py 用于自动修复
- rollout_messages_testwriter.py 用于生成测试
模型权重与 Demo 可在 Hugging Face 获得

📈 基准成绩与背景

在 SWE‑bench Verified 上达到了 60.4% 的问题解决率，高出其他同类模型。
项目代码、模型和使用文档已发布于 GitHub 和 Hugging Face，采用 MIT 许可证开源。
Moonshot AI 是一家成立于 2023 年的中国 AI 公司，定位于开发高性能、多模态、大上下文能力的 LLM，旗下还有 Kimi‑k1.5／Kimi‑VL／Kimi‑Audio 等系列。

🧠 总结

Kimi‑Dev 是一个功能强大的开源编程方向 LLM，专注于自动化代码修复和单元测试生成，并在相关任务上取得了开源最好成绩。如果你的需求是：

自动修复项目 bug
为项目生成或补充测试
研究 AI 在软件工程中的落地应用

那么这个项目非常值得深入研究。你可以进一步查看其 README、代码结构、示例脚本（比如 kimidev/ 文件夹），或者部署 Demo 上手体验。

Github：https://github.com/MoonshotAI/Kimi-Dev

油管：https://youtu.be/NLFRilWNNbA

开源用于软件工程任务的代码生成模型

🚀 核心亮点

📦 使用方式

📈 基准成绩与背景

🧠 总结

MusicLang-基于 Llama 2 的音乐生成模型！

香港工银亚洲银行个人账户开户攻略

YOLO-World：腾讯AI实验室开发的一个实时目标检测工具

斯坦福大学开发出一个几乎不会产生幻觉的模型：WikiChat

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email

🚀 核心亮点

📦 使用方式

📈 基准成绩与背景

🧠 总结

分享此文：

MusicLang-基于 Llama 2 的音乐生成模型！

香港工银亚洲银行个人账户开户攻略

YOLO-World：腾讯AI实验室开发的一个实时目标检测工具

斯坦福大学开发出一个几乎不会产生幻觉的模型：WikiChat

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email