В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»
YouTube приступает к показу обязательной к просмотру рекламы на телевизорах по всему миру - «Новости сети»
YouTube приступает к показу обязательной к просмотру рекламы на телевизорах по всему миру - «Новости сети»
«Первый достойный наследник Disco Elysium»: в Steam вышла фэнтезийная ролевая игра Esoteric Ebb, вдохновлённая Planescape: Torment - «Новости сети»
«Первый достойный наследник Disco Elysium»: в Steam вышла фэнтезийная ролевая игра Esoteric Ebb, вдохновлённая Planescape: Torment - «Новости сети»
Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства» - «Новости сети»
Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства» - «Новости сети»
«Первое хорошее обновление за три года»: легендарная CS:GO вернулась в Steam к радости фанатов - «Новости сети»
«Первое хорошее обновление за три года»: легендарная CS:GO вернулась в Steam к радости фанатов - «Новости сети»
Seagate приступила к массовым поставкам жёстких дисков семейства Mozaic 4+, обеспечивающих ёмкость до 44 Тбайт - «Новости сети»
Seagate приступила к массовым поставкам жёстких дисков семейства Mozaic 4+, обеспечивающих ёмкость до 44 Тбайт - «Новости сети»
Perplexity запустила автономную ИИ-платформу на базе десятка нейросетей - «Новости мира Интернет»
Perplexity запустила автономную ИИ-платформу на базе десятка нейросетей - «Новости мира Интернет»
Google анонсировала новый генератор изображений Nano Banana 2 - «Новости мира Интернет»
Google анонсировала новый генератор изображений Nano Banana 2 - «Новости мира Интернет»
Вышло приложение Nearby Glasses для обнаружения очков с камерой в радиусе 15 метров - «Новости мира Интернет»
Вышло приложение Nearby Glasses для обнаружения очков с камерой в радиусе 15 метров - «Новости мира Интернет»
Обновили алгоритм расчёта ИКС сайта — смотрите результаты в Яндекс Вебмастере — «Блог для вебмастеров»
Обновили алгоритм расчёта ИКС сайта — смотрите результаты в Яндекс Вебмастере — «Блог для вебмастеров»
Google добавила режим Split View в Chrome и аннотации в PDF - «Новости мира Интернет»
Google добавила режим Split View в Chrome и аннотации в PDF - «Новости мира Интернет»
Новости мира Интернет » Новости » В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»

Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования.



Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык.




В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»


Изображение: Google (здесь и далее)



По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке.






Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар.



Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен.



Изображение на обложке: Unsplash


Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования. Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык. Изображение: Google (здесь и далее) По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке. Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар. Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен. Изображение на обложке: Unsplash

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))