繁中

軟體工程任務的開原始碼生成模型

作者: / 11 7 月, 2025

這個項目 基米·德夫 它是由Moonshot AI發布的開源「Coding LLM」，旨在自動修復代碼和編寫測試。其最新型號為 Kimi-Dev-72 B（約727億個參數），在開源領域的SWE平台驗證基準上實現 60.4% 取得了目前最好的開源模型性能

核心亮點

雙框架：BugFixer + TestWriter
- 漏洞修復者 定位錯誤文件和修復代碼
- 測試作家 編寫單元測試並生成失敗和通過的測試用例
  兩者共同努力，確保完成完整且可驗證的維修
中期培訓+強化學習（RL）
- 使用來自真實GitHub問題/PR的近1500億個令牌訓練數據來增強模型代碼理解和定位能力
- 該模型使用「通過測試獎勵」的RL策略，實際上在Docker環境中運行測試，只有所有測試通過時才會獎勵。
測試期間的自我對抗機制（Self-Play）
- BugFixer和TestWriter在推理階段互相「玩自我遊戲」，生成多個候選補丁和測試，並最終選擇最佳結果

收件箱使用

克隆倉庫並安裝環境：git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev pony =3.12點安裝-e。
安裝vLLM（支持CUDA 12.8）並啟動推理服務：pip安裝vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi-Dev-72B --served-model-n-n-dev.
使用項目提供的腳本運行：
- rollout_messages_bugfixer.py 用於自動維修
- rollout_mailings_testwriter.py 用於生成測試
模型權重和演示可在Hugging Face上獲取

📈基準結果和背景

在 SWE長凳已驗證 站在 60.4% 問題解決率高於其他同類模型。
項目代碼、模型和使用文檔已發布在GitHub和Hugging Face上，並在麻省理工學院許可下開源。
Moonshot AI是一家成立於2023年的中國人工智慧公司。它的定位是開發高性能、多模式、大背景LLM。它還擁有Kimi-k1.5/Kimi-BL/Kimi-音頻等系列。

🧠摘要

Kimi-Dev是一家功能強大的開源編程LLM，專注於自動化代碼修復和單元測試生成，並在相關任務中取得了開源的最佳結果。如果您的需求是：

自動修復項目錯誤
為項目生成或補充測試
研究人工智慧在軟體工程中的實施應用

那麼這個項目非常值得深入研究。您可以進一步查看其REAUTE、代碼結構、示例腳本（例如 基米季夫/ 文件夾），或者部署演示即可開始。

Github：https://github.com/MoonshotAI/Kimi-Dev

輸油管：