Google DeepMind представила курсор, который понимает объекты на экране - «Новости мира Интернет» » Новости мира Интернет
FromSoftware подтвердила дату выхода Elden Ring: Tarnished Edition для Nintendo Switch 2 и платное дополнение для других платформ - «Новости сети»
FromSoftware подтвердила дату выхода Elden Ring: Tarnished Edition для Nintendo Switch 2 и платное дополнение для других платформ - «Новости сети»
Anthropic предложила механизм экстренного торможения для развития ИИ - «Новости сети»
Anthropic предложила механизм экстренного торможения для развития ИИ - «Новости сети»
Google начала развёртывать Gemini Avatar — технологию, которая создаёт пугающе реалистичных цифровых двойников - «Новости сети»
Google начала развёртывать Gemini Avatar — технологию, которая создаёт пугающе реалистичных цифровых двойников - «Новости сети»
Астрологи в восторге: новый патч для Heroes of Might & Magic: Olden Era починил понедельники - «Новости сети»
Астрологи в восторге: новый патч для Heroes of Might & Magic: Olden Era починил понедельники - «Новости сети»
AMD отобрала у Intel треть рынка x86-процессоров, пока рынок настольных CPU рухнул на 20 % - «Новости сети»
AMD отобрала у Intel треть рынка x86-процессоров, пока рынок настольных CPU рухнул на 20 % - «Новости сети»
Яндекс обновил Алису AI: помощник получил новые инструменты для работы с фото и покупками - «Новости мира Интернет»
Яндекс обновил Алису AI: помощник получил новые инструменты для работы с фото и покупками - «Новости мира Интернет»
Acer представили несколько новых устройств - «Новости мира Интернет»
Acer представили несколько новых устройств - «Новости мира Интернет»
Яндекс создал инструмент управления показами контента в Поиске для сервисов объявлений - «Новости мира Интернет»
Яндекс создал инструмент управления показами контента в Поиске для сервисов объявлений - «Новости мира Интернет»
В Google Analytics добавили отдельное отображение трафика из ChatGPT и Claude - «Новости мира Интернет»
В Google Analytics добавили отдельное отображение трафика из ChatGPT и Claude - «Новости мира Интернет»
Что нового показали на Google I/O 2026. Часть 1 - «Новости мира Интернет»
Что нового показали на Google I/O 2026. Часть 1 - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » Google DeepMind представила курсор, который понимает объекты на экране - «Новости мира Интернет»

Google и команда DeepMind представили концепцию ИИ-интерфейса, в котором обычный курсор мыши превращается в полноценный инструмент взаимодействия с Gemini.



Новая система позволяет ИИ понимать объект под курсором – изображение, текст, PDF-файл, таблицу или элемент интерфейса. Пользователю больше не нужно составлять длинные запросы в отдельном окне чат-бота. Вместо этого можно указать на объект и дать короткую команду: «сравни это», «объясни это» или «перемести в папку».



В DeepMind считают новый способ общения с ИИ более человеческим, так как жесты и контекст для пользователя зачастую важнее длинных объяснений. Например, система сможет распознать здание на фотографии и сразу построить маршрут, кратко пересказать выделенный PDF-документ или автоматически преобразовать таблицу в диаграмму. В одном из демонстрационных сценариев кадр из туристического видео превратился в ссылку на бронирование ресторана, который распознал Gemini.






Источник: Google (здесь и на обложке)



Разработчики выделяют четыре главных принципа концепции: работа ИИ без отвлечения от текущих задач, взаимодействие через контекст, использование коротких команд и превращение пикселей в интерактивные объекты.



Часть этих возможностей уже начинает появляться в Google Chrome. Пользователи смогут задавать Gemini вопросы о конкретной части страницы с помощью курсора. В будущем похожие функции появятся в устройствах Googlebook через систему Magic Pointer.


Google и команда DeepMind представили концепцию ИИ-интерфейса, в котором обычный курсор мыши превращается в полноценный инструмент взаимодействия с Gemini. Новая система позволяет ИИ понимать объект под курсором – изображение, текст, PDF-файл, таблицу или элемент интерфейса. Пользователю больше не нужно составлять длинные запросы в отдельном окне чат-бота. Вместо этого можно указать на объект и дать короткую команду: «сравни это», «объясни это» или «перемести в папку». В DeepMind считают новый способ общения с ИИ более человеческим, так как жесты и контекст для пользователя зачастую важнее длинных объяснений. Например, система сможет распознать здание на фотографии и сразу построить маршрут, кратко пересказать выделенный PDF-документ или автоматически преобразовать таблицу в диаграмму. В одном из демонстрационных сценариев кадр из туристического видео превратился в ссылку на бронирование ресторана, который распознал Gemini. Источник: Google (здесь и на обложке) Разработчики выделяют четыре главных принципа концепции: работа ИИ без отвлечения от текущих задач, взаимодействие через контекст, использование коротких команд и превращение пикселей в интерактивные объекты. Часть этих возможностей уже начинает появляться в Google Chrome. Пользователи смогут задавать Gemini вопросы о конкретной части страницы с помощью курсора. В будущем похожие функции появятся в устройствах Googlebook через систему Magic Pointer.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

запостил(а)
Аза
Вернуться назад
0

Смотрите также

А что там на главной? )))



Комментарии )))