Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети» » Новости мира Интернет
«Sims, твои дни сочтены»: новый геймплей амбициозного симулятора жизни Paralives впечатлил фанатов жанра - «Новости сети»
«Sims, твои дни сочтены»: новый геймплей амбициозного симулятора жизни Paralives впечатлил фанатов жанра - «Новости сети»
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»
Nvidia призвала пользователей срочно обновить старые драйверы GeForce — в них нашли семёрку опасных уязвимостей - «Новости сети»
Nvidia призвала пользователей срочно обновить старые драйверы GeForce — в них нашли семёрку опасных уязвимостей - «Новости сети»
Бум ИИ загнал производителей SSD и модулей памяти в многомиллионные долги - «Новости сети»
Бум ИИ загнал производителей SSD и модулей памяти в многомиллионные долги - «Новости сети»
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake - «Новости сети»
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake - «Новости сети»
Стартап NextAxis Design выпустил эргономичную мышь-яйцо - «Новости мира Интернет»
Стартап NextAxis Design выпустил эргономичную мышь-яйцо - «Новости мира Интернет»
В Windows 11 добавят возможность перемещения панели задач в разные края экрана - «Новости мира Интернет»
В Windows 11 добавят возможность перемещения панели задач в разные края экрана - «Новости мира Интернет»
Asus выпустила AR-очки для геймеров с частотой 240 Гц - «Новости мира Интернет»
Asus выпустила AR-очки для геймеров с частотой 240 Гц - «Новости мира Интернет»
Google запустила редизайн иконок своих сервисов - «Новости мира Интернет»
Google запустила редизайн иконок своих сервисов - «Новости мира Интернет»
Хотите, чтобы клиенты выбирали вас в Поиске? Подключите «Баллы за отзывы» в Яндекс Вебмастере! — «Блог для вебмастеров»
Хотите, чтобы клиенты выбирали вас в Поиске? Подключите «Баллы за отзывы» в Яндекс Вебмастере! — «Блог для вебмастеров»
Новости мира Интернет » Новости » Новости мира Интернет » Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»

Google представила новое семейство генеративных моделей искусственного интеллекта Gemini Omni, предназначенное для создания контента из любых типов входных данных. Первым продуктом линейки стала нейросеть Gemini Omni Flash, способная генерировать видеоролики на основе текста, фотографий, аудио или других видеозаписей. Алгоритм объединяет мультимодальные возможности с глубоким пониманием законов физики и реального мира.




Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены





Больше кадров — больше лага: тестирование латентности с генерацией кадров DLSS и FSR





От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте





Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone





Компьютер месяца — май 2026 года





Можно ли экономить на DDR5 для Ryzen? Сравниваем дешёвую память с дорогой




Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»


Источник изображений: Google



Ключевым отличием новинки от существующей модели Veo, как пишет Google в своём блоге, является функция преобразования одного видео в другое. Алгоритм не просто генерирует визуальный ряд, но и позволяет редактировать исходные кадры с помощью естественного языка в диалоговом формате, сохраняя логику сцены и последовательность действий персонажей при каждом новом запросе. Как отмечает старший директор по исследованиям Google DeepMind Думитру Эрхан (Dumitru Erhan), в настоящее время система может создавать ролики со звуком продолжительностью до 10 секунд, однако компания уже работает над увеличением этого лимита.



Модель опирается на обширную базу знаний экосистемы Gemini, что позволяет ей создавать сцены с учётом исторического и научного контекста, а также точно воспроизводить гравитацию или динамику жидкостей. Технический директор Google DeepMind и главный ИИ-архитектор Google Корай Кавукчуоглу (Koray Kavukcuoglu) подчеркнул, что новая технология обладает гораздо большей информацией об устройстве мира, чем предыдущие разработки. Пользователи также получат возможность сгенерировать собственный цифровой аватар и озвучить его своим голосом. Руководитель команды разработчиков продукта Николь Брихтова (Nicole Brichtova) указала, что подобная функция интеграции собственной внешности пользовалась огромным спросом в прошлогодней модели для генерации изображений Nano Banana, с помощью которой было создано более 50 миллиардов картинок.



В целях безопасности корпорация пока ограничивает алгоритм в возможности изменять чужую речь на видео, а все сгенерированные ролики автоматически помечаются невидимым цифровым водяным знаком SynthID для проверки подлинности контента. В будущем разработчики планируют добавить поддержку вывода аудио и статических изображений. Модель Gemini Omni Flash уже доступна глобально для подписчиков тарифов Google AI Plus, Pro и Ultra через приложение Gemini и сервис Google Flow.



Начиная с этой недели бесплатный доступ к генератору также открывается для пользователей в приложениях YouTube Shorts и YouTube Create App.


Google представила новое семейство генеративных моделей искусственного интеллекта Gemini Omni, предназначенное для создания контента из любых типов входных данных. Первым продуктом линейки стала нейросеть Gemini Omni Flash, способная генерировать видеоролики на основе текста, фотографий, аудио или других видеозаписей. Алгоритм объединяет мультимодальные возможности с глубоким пониманием законов физики и реального мира. Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены Больше кадров — больше лага: тестирование латентности с генерацией кадров DLSS и FSR От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone Компьютер месяца — май 2026 года Можно ли экономить на DDR5 для Ryzen? Сравниваем дешёвую память с дорогой Источник изображений: Google Ключевым отличием новинки от существующей модели Veo, как пишет Google в своём блоге, является функция преобразования одного видео в другое. Алгоритм не просто генерирует визуальный ряд, но и позволяет редактировать исходные кадры с помощью естественного языка в диалоговом формате, сохраняя логику сцены и последовательность действий персонажей при каждом новом запросе. Как отмечает старший директор по исследованиям Google DeepMind Думитру Эрхан (Dumitru Erhan), в настоящее время система может создавать ролики со звуком продолжительностью до 10 секунд, однако компания уже работает над увеличением этого лимита. Модель опирается на обширную базу знаний экосистемы Gemini, что позволяет ей создавать сцены с учётом исторического и научного контекста, а также точно воспроизводить гравитацию или динамику жидкостей. Технический директор Google DeepMind и главный ИИ-архитектор Google Корай Кавукчуоглу (Koray Kavukcuoglu) подчеркнул, что новая технология обладает гораздо большей информацией об устройстве мира, чем предыдущие разработки. Пользователи также получат возможность сгенерировать собственный цифровой аватар и озвучить его своим голосом. Руководитель команды разработчиков продукта Николь Брихтова (Nicole Brichtova) указала, что подобная функция интеграции собственной внешности пользовалась огромным спросом в прошлогодней модели для генерации изображений Nano Banana, с помощью которой было создано более 50 миллиардов картинок. В целях безопасности корпорация пока ограничивает алгоритм в возможности изменять чужую речь на видео, а все сгенерированные ролики автоматически помечаются невидимым цифровым водяным знаком SynthID для проверки подлинности контента. В будущем разработчики планируют добавить поддержку вывода аудио и статических изображений. Модель Gemini Omni Flash уже доступна глобально для подписчиков тарифов Google AI Plus, Pro и Ultra через приложение Gemini и сервис Google Flow. Начиная с этой недели бесплатный доступ к генератору также открывается для пользователей в приложениях YouTube Shorts и YouTube Create App.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))