В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Что такое мониторинг работы сотрудников
Что такое мониторинг работы сотрудников
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Huawei представила беспроводной роутер X3 Pro с уникальным дизайном - «Новости мира Интернет»
Huawei представила беспроводной роутер X3 Pro с уникальным дизайном - «Новости мира Интернет»
OpenAI модернизировала голосовой режим ChatGPT: теперь он работает прямо в чате - «Новости мира Интернет»
OpenAI модернизировала голосовой режим ChatGPT: теперь он работает прямо в чате - «Новости мира Интернет»
Яндекс и исследователи из МГУ разработали метод обучения ИИ сложным правилам русского языка - «Новости мира Интернет»
Яндекс и исследователи из МГУ разработали метод обучения ИИ сложным правилам русского языка - «Новости мира Интернет»
Новости мира Интернет » Новости » В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»

Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования.



Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык.




В Google представили нейросеть для генерации видео из фотографий - «Новости мира Интернет»


Изображение: Google (здесь и далее)



По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке.






Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар.



Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен.



Изображение на обложке: Unsplash

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Команда Google анонсировала нового ИИ-помощника VLOGGER, который генерирует анимированные видео по фото человека. Пока это исследовательский проект, сервис недоступен для использования. Загрузив картинку и аудиофайл, пользователь получает реалистичный ролик говорящего человека – модель способна осуществлять не только синхронизацию губ, но и добавлять жестикуляцию рук, закрывать и открывать герою видео глаза. Кроме того, VLOGGER может изменить выражение лица в уже отснятом материале или отредактировать движение губ при переводе видео на другой язык. Изображение: Google (здесь и далее) По мнению создателей, технология будет полезна в творчестве, при онлайн-общении, в сфере образования и при создании виртуальных ассистентов. Один из возможных вариантов применения – перевод видео. К примеру, можно взять существующее видео на английском языке и отредактировать движения губ и лица, чтобы они соответствовали новому переведенному аудио на испанском языке. Чтобы VLOGGER создавал визуально-достоверные видео, не нужно обучать нейросеть на базе роликов с изображением человека – достаточно загрузить всего одну качественную фотографию и аудиодорожку с речью, которую будет произносить аватар. Пока модель работает с ограничениями, например, может создавать только короткие видеоролики, не все движения человека в кадре получаются естественными, а фон остается статичен. Изображение на обложке: Unsplash

Смотрите также

А что там на главной? )))



Комментарии )))