MiroThinker v1.5是一款一流的開源人工智慧搜索代理,具有256 K上下文窗口,單個任務中最多可執行400個工具調用,支持深度網絡研究、代碼執行和多步驟推理。該工具超過了HLE-text(39.2%)、BrowseComp(69.8%)和GAIA(80.8%)等基準,以低成本優勢超越了其他自由代理商。您可以獲得準確的現實世界研究支持-例如查找arXiv學術論文、回答覆雜查詢等,它比付費工具更高效、更便宜,並且您可以在GitHub和Hugging Face上獲得對該工具的完全開源訪問權限。
這是一 專為「深度搜索和研究」而設計的開源人工智慧代理.
定位MiroThinker
MiroThinker v1.5是一款高性能、低成本、深度人工智慧搜索代理。
它專門用於:檢查數據、運行代碼和多步推理。
它來自 MiroMindAI,
目標非常明確:
在「搜索+推理」方面,它比大多數自由球員更強,
同時,也不依靠燒錢。
它與常規人工智慧搜索工具有何不同?
我們先來看看三個硬指標,這也是MiroThinker最「硬核」的部分。
256 K上下文窗口:這是生產力
256 K上下文意味著什麼?
這不是「我們可以聊更長時間」,
相反:
- 它可以一次吃掉大量網絡內容
- 能夠集成多篇論文、報告和代碼
- 消除重複丟失上下文的需要並減少信息丟失
對於研究任務,這是 了質的變化.
您可以製作:
- 同時分析了十幾篇arXiv論文
- 比較多種技術解決方案的詳細信息
- 無「失憶」的長鏈推理
單個任務中最多可調用400個工具:真正的「可以運行」
許多代理聲稱「支持工具呼叫」,
但實際上只叫了幾次就結束了。
MiroThinker v1.5是 專為「長期任務」而設計:
- 搜索|解析|然後搜索
- 下載|運行|分析|修復
- 中間的失敗可以繼續
400次工具調用意味著:
它不是一次性的表演,而是持續有效的。
這也是其能夠進行「深入網絡研究」的關鍵。
不僅搜索,還運行代碼
MiroThinker所做的不僅僅是「檢查」。
它可以:
- 執行代碼
- 處理數據
- 對搜索結果進行二次計算和驗證
這在複雜問題中非常重要。
例如:
你不僅僅想「找到答案」,
而是想 以確認這個答案是否可靠.
基準測試結果說明了什麼?
許多項目避免基準測試,
但米羅·辛克恰恰相反。
在幾個 非常實用的評估集,它的結果非常引人注目:
- HLE-text:39.2%
- BrowseComp:69.8%
- GAIA:80.8%
這些測試本質上不是關於「你是否可以聊天」,
相反:
你能查一下信息嗎?
你能講清楚嗎?
在複雜的環境中能否完成任務
在這些維度中,MiroThinker 穩定超過了大多數自由球員.
「性價比高」?
這是一個大事實。
很多「外表堅強」的人工智慧代理:
- 或者依賴昂貴的型號
- 或者消費大量代幣
- 或者根本不開源
MiroThinker的核心優勢之一是:
在免費/低成本範圍內,性能被推向極限。
這對於個人開發人員、學生和獨立研究人員至關重要。