В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет» » Новости мира Интернет
OpenAI запустила режим Lockdown Mode для защиты ChatGPT от кибератак - «Новости мира Интернет»
OpenAI запустила режим Lockdown Mode для защиты ChatGPT от кибератак - «Новости мира Интернет»
Google выпустила первую бета-версию Android 17 - «Новости мира Интернет»
Google выпустила первую бета-версию Android 17 - «Новости мира Интернет»
Яндекс Карты начали подстраивать маршруты под стиль вождения пользователей - «Новости мира Интернет»
Яндекс Карты начали подстраивать маршруты под стиль вождения пользователей - «Новости мира Интернет»
Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит SpaceX в новой лунной гонке - «Новости сети»
Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит SpaceX в новой лунной гонке - «Новости сети»
Китайская Unitree показала, как человекоподобный робот собирает детали для своих собратьев - «Новости сети»
Китайская Unitree показала, как человекоподобный робот собирает детали для своих собратьев - «Новости сети»
Количество пользователей спутникового интернета Starlink превысило 10 млн человек - «Новости сети»
Количество пользователей спутникового интернета Starlink превысило 10 млн человек - «Новости сети»
Власти США признали парниковые газы безопасными для людей — ДВС, уголь и нефть снова в игре - «Новости сети»
Власти США признали парниковые газы безопасными для людей — ДВС, уголь и нефть снова в игре - «Новости сети»
У NASA снова испортилась лунная ракета SLS — при попытке её заправить, топливо перестало поступать в баки - «Новости сети»
У NASA снова испортилась лунная ракета SLS — при попытке её заправить, топливо перестало поступать в баки - «Новости сети»
Anthropic представила Claude Opus 4.6 с поддержкой Agent Teams и контекстом на 1 млн токенов - «Новости мира Интернет»
Anthropic представила Claude Opus 4.6 с поддержкой Agent Teams и контекстом на 1 млн токенов - «Новости мира Интернет»
Apple планируют обновить ряд устройств в первой половине 2026 года - «Новости мира Интернет»
Apple планируют обновить ряд устройств в первой половине 2026 года - «Новости мира Интернет»
Новости мира Интернет » Новости » В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет»

Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM.



Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии.






Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM



MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные.



На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.


Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM . Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии. Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные. На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

запостил(а)
Macey
Вернуться назад
-1

Смотрите также

А что там на главной? )))



Комментарии )))