В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет» » Новости мира Интернет
«Sims, твои дни сочтены»: новый геймплей амбициозного симулятора жизни Paralives впечатлил фанатов жанра - «Новости сети»
«Sims, твои дни сочтены»: новый геймплей амбициозного симулятора жизни Paralives впечатлил фанатов жанра - «Новости сети»
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных - «Новости сети»
Nvidia призвала пользователей срочно обновить старые драйверы GeForce — в них нашли семёрку опасных уязвимостей - «Новости сети»
Nvidia призвала пользователей срочно обновить старые драйверы GeForce — в них нашли семёрку опасных уязвимостей - «Новости сети»
Бум ИИ загнал производителей SSD и модулей памяти в многомиллионные долги - «Новости сети»
Бум ИИ загнал производителей SSD и модулей памяти в многомиллионные долги - «Новости сети»
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake - «Новости сети»
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake - «Новости сети»
Стартап NextAxis Design выпустил эргономичную мышь-яйцо - «Новости мира Интернет»
Стартап NextAxis Design выпустил эргономичную мышь-яйцо - «Новости мира Интернет»
В Windows 11 добавят возможность перемещения панели задач в разные края экрана - «Новости мира Интернет»
В Windows 11 добавят возможность перемещения панели задач в разные края экрана - «Новости мира Интернет»
Asus выпустила AR-очки для геймеров с частотой 240 Гц - «Новости мира Интернет»
Asus выпустила AR-очки для геймеров с частотой 240 Гц - «Новости мира Интернет»
Google запустила редизайн иконок своих сервисов - «Новости мира Интернет»
Google запустила редизайн иконок своих сервисов - «Новости мира Интернет»
Хотите, чтобы клиенты выбирали вас в Поиске? Подключите «Баллы за отзывы» в Яндекс Вебмастере! — «Блог для вебмастеров»
Хотите, чтобы клиенты выбирали вас в Поиске? Подключите «Баллы за отзывы» в Яндекс Вебмастере! — «Блог для вебмастеров»
Новости мира Интернет » Новости » В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет»

Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM.



Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии.






Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM



MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные.



На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.


Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM . Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии. Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные. На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

запостил(а)
Macey
Вернуться назад
-1

Смотрите также

А что там на главной? )))



Комментарии )))