Фото: depositphotos
Компанія Google анонсувала нову версію моделі штучного інтелекту — Gemini 2.5 Computer Use, яка здатна повноцінно працювати в браузері як людина: натискати кнопки, скролити сторінки, заповнювати форми та взаємодіяти з інтерфейсом сайтів.
Про це повідомляє Google.
Це дозволяє моделі виконувати завдання навіть там, де немає відкритого API, зокрема — тестувати вебінтерфейси, шукати інформацію чи заповнювати онлайн-документи. За словами Google, Gemini 2.5 поєднує зорове розпізнавання та логічне міркування, щоб точно виконувати інструкції користувача.
Gemini 2.5 підтримує 13 основних дій — відкриття вкладок, введення тексту, перетягування елементів, перемикання між сторінками тощо. При цьому система працює лише через браузер, не маючи доступу до операційної системи, що підвищує безпеку використання.
Модель уже доступна для розробників через Google AI Studio та Vertex AI, а також у відкритій демонстрації на платформі Browserbase, де можна спостерігати, як штучний інтелект виконує прості вебзавдання — наприклад, грає у 2048 чи шукає обговорення на Hacker News.
До слова, Google оновлює Play Games: підказки від Gemini прямо під час гри. Геймери отримають змогу відстежувати статистику і користуватися ШІ-порадником, який допомагатиме під час проходження ігор і навіть у трансляціях.
Юлія Люшньова - pravdatutnews.com