В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»
Постапокалиптический шутер Metro 2039 выйдет в феврале 2027 года — новый геймплейный трейлер - «Новости сети»
Постапокалиптический шутер Metro 2039 выйдет в феврале 2027 года — новый геймплейный трейлер - «Новости сети»
Первое и последнее сюжетное дополнение к Doom: The Dark Ages вышло из тени — геймплей и дата выхода «Откровений» - «Новости сети»
Первое и последнее сюжетное дополнение к Doom: The Dark Ages вышло из тени — геймплей и дата выхода «Откровений» - «Новости сети»
Суровая средневековая Англия, возвращение к корням и Unreal Engine 5: анонсирована Stronghold 4 - «Новости сети»
Суровая средневековая Англия, возвращение к корням и Unreal Engine 5: анонсирована Stronghold 4 - «Новости сети»
Глава Nvidia призвал не бояться наблюдаемого обвала на рынке акций и покупать их по низким ценам - «Новости сети»
Глава Nvidia призвал не бояться наблюдаемого обвала на рынке акций и покупать их по низким ценам - «Новости сети»
ASML стала самой дорогой компанией в истории Европы — капитализация достигла $674 млрд - «Новости сети»
ASML стала самой дорогой компанией в истории Европы — капитализация достигла $674 млрд - «Новости сети»
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Google представила Gemma 4 12B – мультимодальную ИИ-модель для обычных ноутбуков - «Новости мира Интернет»
Google представила Gemma 4 12B – мультимодальную ИИ-модель для обычных ноутбуков - «Новости мира Интернет»
В Яндекс ID добавлен единый центр управления коммуникациями - «Новости мира Интернет»
В Яндекс ID добавлен единый центр управления коммуникациями - «Новости мира Интернет»
Новости мира Интернет » Новости » В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»

Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования.



Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык.




В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»


Изображение: Google (здесь и далее)



По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке.






Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар.



Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен.



Изображение на обложке: Unsplash


Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования. Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык. Изображение: Google (здесь и далее) По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке. Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар. Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен. Изображение на обложке: Unsplash

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))