繁中

人工智慧圖像生成和編輯領域的神秘模型

「納米香蕉」的真實身份尚未公開,但其出色的表現引發了廣泛討論。

什麼是Nano Banana?

1. AI圖像生成和編輯模型

  • 納米香蕉 這是一款尚未正式發布的神秘人工智慧圖像生成和編輯模型。它首先是由用戶在人工智慧模型盲測試平台LMArena中偶然發現的。
  • 它可以根據自然語言提示準確編輯圖像,具有保持背景不變、對象識別能力強、一致性等顯著優勢

2.與谷歌的潛在聯繫

  • 儘管沒有官方證實,但業內普遍猜測 納米香蕉 或者是谷歌的內部項目,部分原因是其性能與之前的谷歌型號(例如Imagen、Gemini)相似
  • 有趣的是,Google AI Studio產品負責人Logan Kilpatrick在X(原Twitter)上發布了一個香蕉表情符號,DeepMind產品經理Naina Raisinghani也分享了一張「膠帶香蕉」藝術品的照片,據信這是一種暗示。

3.主要特徵和能力

  • 高精度快速理解:能夠理解複雜的多步驟自然語言指令並準確執行
  • 場景一致性強:編輯時可以保持原始背景、人物或對象連續一致
  • 多功能圖像處理:支持改變圖片中的部分內容,同時保持整體風格和內容邏輯
  • 有報導稱,在一些常見任務上,它比Photoshop更直觀,並且可能會取代公眾認知中的一些Photoshop功能。

4.試用渠道

  • 要體驗Nano Banana,您可以訪問 拉馬雷納 在的「戰鬥模式」區域,Nano Banana型號偶爾會被隨機推送給用戶進行測試
  • Flux-AI(或FluxProWeb)等一些平台也提供有限的體驗機會。

5.社區反饋和討論 **

Reddit社區的一位用戶指出:

「我想說,它生成的圖像具有令人印象深刻的一致性..國際海事組織的「納米香蕉」一致性水平約為90-95%」
「它是調整照片的一部分,而不是重現整張照片……給人一種一致性的錯覺。」(

中國媒體上的用戶也驚嘆於其「完美的性格一致性」,例如五官和嘴角的變化很少

項目內容
定義高性能人工智慧圖像生成和編輯模型
特性場景一致、提示理解準確、編輯準確
身份據推測這是谷歌內部項目,並有相關提示
使用在LMArena的戰鬥模式中隨機體驗,或者在Flux-AI上嘗試

誰開發了納米香蕉?

  • 常見猜測:谷歌是幕後黑手
    儘管尚未得到官方證實,但有幾個跡象表明谷歌或其DeepMind團隊的存在:在LMArena上匿名露面但表現出色、谷歌工程師在社交媒體上頻繁使用香蕉子,以及雙子座風格的界面。
  • TechNews和Business Insider的報導
    TechNews報導稱,這是谷歌開發的最新高級AI圖像編輯器,具有「身份一致性維護」和「自然語言圖像編輯」等功能。
    Business Insider提到,儘管谷歌尚未正式認可,但它在訪問LMArena時確實體驗到了Nano Banana的出色表現

目前是否已公開?

  • 僅適用於LMArena的盲測試系統
    該模型現在僅匿名出現在LMArena中,確切的使用時間和頻率無法預測
  • 部分平台已經有了試用渠道
    報導表明,Nano Banana可能會通過Flux AI、FluxProWeb甚至nanobanana.ai等平台以「實驗性」的方式被用戶調用,但其穩定性和可用性尚未得到官方證實。

總結概述

方面描述
模型類型神秘的AI圖像生成和編輯模型,善於修改圖像同時保持一致性
首次亮相LMArena的匿名對照測試進入視野並引起關注
性能特性字符一致性、自然語言命令編輯、快速響應
可能的開發者人們普遍猜測是Google / DeepMind,但尚未得到官方證實
使用目前主要通過LMArena盲測出現,一些第三方平台可能會提供體驗渠道。

參考連結:
https://www.creativebloq.com/ai/ai-art/what-is-nano-banana-and-is-it-really-the-end-of-photoshop

輸油管:

返回頂端