繁中

軟體工程任務的開原始碼生成模型

這個項目 基米·德夫 它是由Moonshot AI發布的開源「Coding LLM」,旨在自動修復代碼和編寫測試。其最新型號為 Kimi-Dev-72 B(約727億個參數),在開源領域的SWE平台驗證基準上實現 60.4% 取得了目前最好的開源模型性能

核心亮點

  • 雙框架:BugFixer + TestWriter
    • 漏洞修復者 定位錯誤文件和修復代碼
    • 測試作家 編寫單元測試並生成失敗和通過的測試用例
      兩者共同努力,確保完成完整且可驗證的維修
  • 中期培訓+強化學習(RL)
    • 使用來自真實GitHub問題/PR的近1500億個令牌訓練數據來增強模型代碼理解和定位能力
    • 該模型使用「通過測試獎勵」的RL策略,實際上在Docker環境中運行測試,只有所有測試通過時才會獎勵。
  • 測試期間的自我對抗機制(Self-Play)
    • BugFixer和TestWriter在推理階段互相「玩自我遊戲」,生成多個候選補丁和測試,並最終選擇最佳結果

收件箱使用

  1. 克隆倉庫並安裝環境:git clone https://github.com/MoonshotAI/Kimi-Dev.git conda create -n kimidev pony =3.12點安裝-e。
  2. 安裝vLLM(支持CUDA 12.8)並啟動推理服務:pip安裝vllm --extra-index-url https://download.pytorch.org/whl/cu128 vllm serve Kimi-Dev-72B --served-model-n-n-dev.
  3. 使用項目提供的腳本運行:
    • rollout_messages_bugfixer.py 用於自動維修
    • rollout_mailings_testwriter.py 用於生成測試
  4. 模型權重和演示可在Hugging Face上獲取

📈基準結果和背景

  • 在 SWE長凳已驗證 站在 60.4% 問題解決率高於其他同類模型。
  • 項目代碼、模型和使用文檔已發布在GitHub和Hugging Face上,並在麻省理工學院許可下開源。
  • Moonshot AI是一家成立於2023年的中國人工智慧公司。它的定位是開發高性能、多模式、大背景LLM。它還擁有Kimi-k1.5/Kimi-BL/Kimi-音頻等系列。

🧠摘要

Kimi-Dev是一家功能強大的開源編程LLM,專注於自動化代碼修復和單元測試生成,並在相關任務中取得了開源的最佳結果。如果您的需求是:

  • 自動修復項目錯誤
  • 為項目生成或補充測試
  • 研究人工智慧在軟體工程中的實施應用

那麼這個項目非常值得深入研究。您可以進一步查看其REAUTE、代碼結構、示例腳本(例如 基米季夫/ 文件夾),或者部署演示即可開始。

Github:https://github.com/MoonshotAI/Kimi-Dev

輸油管:

返回頂端