В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет» » Новости мира Интернет
Израиль принял на вооружение лазерную пушку «Железный луч» — проблему потерь энергии в воздухе решила адаптивная оптика - «Новости сети»
Израиль принял на вооружение лазерную пушку «Железный луч» — проблему потерь энергии в воздухе решила адаптивная оптика - «Новости сети»
Китайская BYD показала самый слабый рост продаж за пять лет - «Новости сети»
Китайская BYD показала самый слабый рост продаж за пять лет - «Новости сети»
Nvidia ведёт переговоры о покупке израильского ИИ-стартапа AI21 Labs за $2-3 млрд - «Новости сети»
Nvidia ведёт переговоры о покупке израильского ИИ-стартапа AI21 Labs за $2-3 млрд - «Новости сети»
MSI представила два 32-дюймовых игровых монитора с экранами 4K QD-OLED - «Новости сети»
MSI представила два 32-дюймовых игровых монитора с экранами 4K QD-OLED - «Новости сети»
Neuralink начнёт массовое производство мозговых имплантов в 2026 году - «Новости сети»
Neuralink начнёт массовое производство мозговых имплантов в 2026 году - «Новости сети»
«Выглядит лучше, чем современные Call of Duty и Battlefield»: игроков впечатлил геймплей китайского шутера The Defiant в духе Medal of Honor - «Новости сети»
«Выглядит лучше, чем современные Call of Duty и Battlefield»: игроков впечатлил геймплей китайского шутера The Defiant в духе Medal of Honor - «Новости сети»
Disco Elysium во вселенной мрачного будущего: журналист поделился впечатлениями от закрытой «альфы» Warhammer 40,000: Dark Heresy - «Новости сети»
Disco Elysium во вселенной мрачного будущего: журналист поделился впечатлениями от закрытой «альфы» Warhammer 40,000: Dark Heresy - «Новости сети»
CD Projekt продала цифровой магазин GOG, чтобы сосредоточиться на создании больших RPG - «Новости сети»
CD Projekt продала цифровой магазин GOG, чтобы сосредоточиться на создании больших RPG - «Новости сети»
TSMC приступила к массовому производству 2-нм чипов без лишнего шума - «Новости сети»
TSMC приступила к массовому производству 2-нм чипов без лишнего шума - «Новости сети»
Nvidia купила часть Intel за $5 млрд — теперь компании будут вместе противостоять AMD - «Новости сети»
Nvidia купила часть Intel за $5 млрд — теперь компании будут вместе противостоять AMD - «Новости сети»
Новости мира Интернет » Новости » В Google представили нейросеть, которая создает музыку по текстовому описанию - «Новости мира Интернет»

Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM.



Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии.






Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM



MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные.



На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Разработчики Google Research создали нейросеть MusicLM, генерирующую музыку в любом жанре по текстовому описанию. Модель обучали на 280 тысячах часов записи, информация о ней и примеры работ представлены на странице MusicLM . Нейросеть может сгенерировать композицию в 24 кГц и в любом жанре, улавливая даже незначительные нюансы в аннотации. Это хорошо показано на примерах, где по запросам модель должна была создать «основой саундтрек аркадной игры» с «запоминающимся гитарным рифом», или же «слияние реггетона и электронной танцевальной музыки с космическим звучанием». В качестве задания даже можно представить описание картины, напев или же насвистывание мелодии. Пример текстового описания картины, которое легло в основу аудио. Изображение: MusicLM MusicLM также может объединить несколько аннотаций и сгенерировать по ним «музыкальную историю», где один фрагмент плавно перетекает в другой. Также нейросеть может учитывать уровень музыканта: как пишет Rozetked, по запросам «начинающий пианист» и «пианист-виртуоз» результаты выходят совершенно разные. На данном этапе модель слабо справляется с генерацией вокала – синтезированная речь пока у нее выходит неразборчивой. Также ряд композиций звучат довольно странно, у них наблюдается заметно искаженное качество. Вдобавок, компания Google пока не готова представить разработку в общий доступ в связи с рисками, связанными с авторскими правами и возможными исками по ним.

запостил(а)
Macey
Вернуться назад
-1

Смотрите также

А что там на главной? )))



Комментарии )))