這個項目 基米·德夫 它是由Moonshot AI發布的開源「Coding LLM」,旨在自動修復代碼和編寫測試。其最新型號為 Kimi-Dev-72 B(約727億個參數),在開源領域的SWE平台驗證基準上實現 60.4% 取得了目前最好的開源模型性能
核心亮點
- 雙框架:BugFixer + TestWriter
- 漏洞修復者 定位錯誤文件和修復代碼
- 測試作家 編寫單元測試並生成失敗和通過的測試用例
兩者共同努力,確保完成完整且可驗證的維修
- 中期培訓+強化學習(RL)
- 使用來自真實GitHub問題/PR的近1500億個令牌訓練數據來增強模型代碼理解和定位能力
- 該模型使用「通過測試獎勵」的RL策略,實際上在Docker環境中運行測試,只有所有測試通過時才會獎勵。
- 測試期間的自我對抗機制(Self-Play)
- BugFixer和TestWriter在推理階段互相「玩自我遊戲」,生成多個候選補丁和測試,並最終選擇最佳結果
收件箱使用
- 克隆倉庫並安裝環境:
git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev pony =3.12點安裝-e。 - 安裝vLLM(支持CUDA 12.8)並啟動推理服務:
pip安裝vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi-Dev-72B --served-model-n-n-dev. - 使用項目提供的腳本運行:
rollout_messages_bugfixer.py用於自動維修rollout_mailings_testwriter.py用於生成測試
- 模型權重和演示可在Hugging Face上獲取
📈基準結果和背景
- 在 SWE長凳已驗證 站在 60.4% 問題解決率高於其他同類模型。
- 項目代碼、模型和使用文檔已發布在GitHub和Hugging Face上,並在麻省理工學院許可下開源。
- Moonshot AI是一家成立於2023年的中國人工智慧公司。它的定位是開發高性能、多模式、大背景LLM。它還擁有Kimi-k1.5/Kimi-BL/Kimi-音頻等系列。
🧠摘要
Kimi-Dev是一家功能強大的開源編程LLM,專注於自動化代碼修復和單元測試生成,並在相關任務中取得了開源的最佳結果。如果您的需求是:
- 自動修復項目錯誤
- 為項目生成或補充測試
- 研究人工智慧在軟體工程中的實施應用
那麼這個項目非常值得深入研究。您可以進一步查看其REAUTE、代碼結構、示例腳本(例如 基米季夫/ 文件夾),或者部署演示即可開始。
Github:https://github.com/MoonshotAI/Kimi-Dev
輸油管: