Google DeepMind在機器人上安裝了名為Gemini 1.5 Pro的系統。這不是普通的升級。這個東西賦予機器人記憶和導航的能力。
想像一下,這個機器人可以在近9000平方英尺的區域內執行57項不同的任務,成功率為90%。這不是一項簡單的任務。例如,找一個地方畫畫。機器人不僅理解它,還會帶你到一個大白板上。這個操作簡直比真人更可靠。
該系統的強大之處在於它可以處理多模式長上下文窗口,這意味著機器人不僅可以記住關鍵位置,還可以理解人類指令、視頻指南,甚至用常識推理。就像谷歌員工的例子一樣,機器人不僅了解「畫畫的地方」,還知道找到一個有大白板的地方。
而且,這些機器人在之前的項目中已經熟悉了辦公環境,並且通過「多模式命令導航演示」了解了空間布局。「DeepMind的團隊還使用分層視覺語言運動(VLA)技術,使機器人能夠理解書面、繪圖命令和手勢指令。
該系統的核心是允許機器人在複雜的空間中自由移動,而不需要人類的持續引導。他們可以記住環境、理解指令,然後以自己的方式完成任務。這種能力使機器人在實際應用中更加靈活和有用。
簡而言之,Google DeepMind的技術不僅讓機器人變得更聰明,還讓它們能夠更好地為現實世界中的人類服務。這就像為機器人打開了一扇新大門,讓機器人進入我們的生活,成為我們工作和探索世界的夥伴。未來的機器人可能不再是冰冷的機器,而是我們生活中的智能夥伴。
如果您想了解更多信息,可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝
英語原文:https://www.theverge.com/2024/7/11/24196402/google-deepmind-gemini-1-5-pro-robot-navigation
輸油管: