BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%
Технологии
Korp&Co visual
Google превращает курсор мыши в инструмент для ИИ-агента
#31137 · 13.05.2026
Технологии

Google превращает курсор мыши в инструмент для ИИ-агента

Курсор перестал быть просто индикатором координат на экране: инженеры Google DeepMind представили технологию, превращающую наведение мыши в полноценное взаимодействие с искусственным интеллектом. Вместо копирования данных в чат-боты пользователи смогут указывать на объекты в интерфейсе и отдавать короткие команды, опираясь на визуальный контекст, который система считывает в реальном времени.

Курсор перестал быть просто индикатором координат на экране: инженеры Google DeepMind представили технологию, превращающую наведение мыши в полноценное взаимодействие с искусственным интеллектом. Вместо копирования данных в чат-боты пользователи смогут указывать на объекты в интерфейсе и отдавать короткие команды, опираясь на визуальный контекст, который система считывает в реальном времени.

Концепция AI-enabled pointer устраняет барьер между пользователем и алгоритмом. Сейчас для анализа информации приходится переключаться между окнами, копировать фрагменты текста или загружать изображения в нейросеть. Новая разработка позволяет Gemini «видеть» контент непосредственно под курсором: будь то рецепт в PDF, таблица с данными или фотография архитектурного объекта. ИИ распознает элементы интерфейса не как набор пикселей, а как осмысленные сущности, готовые к обработке.

В основе подхода лежат четыре принципа, включая полный отказ от переключения между приложениями и использование естественного языка вместо сложных промптов. Разработчики стремятся имитировать человеческое общение, где речь дополняется жестами. Система понимает намерение пользователя, связывая указание мышью с конкретной задачей, например, изменением масштаба ингредиентов или построением маршрута до точки на карте.

Первые шаги к внедрению уже сделаны: в браузере Chrome появилась функция вызова Gemini для анализа содержимого веб-страниц, а для будущих ноутбуков Googlebook готовится технология Magic Pointer. Эти инструменты превращают компьютер из пассивного устройства в среду, где ИИ-агент выступает активным помощником, способным интерпретировать действия человека на лету.

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!