Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет» » Новости мира Интернет
Google добавила режим Split View в Chrome и аннотации в PDF - «Новости мира Интернет»
Google добавила режим Split View в Chrome и аннотации в PDF - «Новости мира Интернет»
В Paint добавили функцию произвольного вращения области на любой угол - «Новости мира Интернет»
В Paint добавили функцию произвольного вращения области на любой угол - «Новости мира Интернет»
MacBook Pro на M6 получит OLED, сенсорный экран и Dynamic Island - «Новости мира Интернет»
MacBook Pro на M6 получит OLED, сенсорный экран и Dynamic Island - «Новости мира Интернет»
Что нового показали Samsung на Galaxy Unpacked 2026 - «Новости мира Интернет»
Что нового показали Samsung на Galaxy Unpacked 2026 - «Новости мира Интернет»
Самый дешёвый тариф YouTube Premium теперь предлагает фоновый режим и скачивание видео - «Новости сети»
Самый дешёвый тариф YouTube Premium теперь предлагает фоновый режим и скачивание видео - «Новости сети»
Twitch отказался от блокировок «всё или ничего» и разделил наказания - «Новости сети»
Twitch отказался от блокировок «всё или ничего» и разделил наказания - «Новости сети»
Китай намерен увеличить выпуск передовых чипов в 25 раз к концу десятилетия - «Новости сети»
Китай намерен увеличить выпуск передовых чипов в 25 раз к концу десятилетия - «Новости сети»
Тим Кук признался, что «спал с одним открытым глазом» после секретного брифинга ЦРУ о Тайване и TSMC - «Новости сети»
Тим Кук признался, что «спал с одним открытым глазом» после секретного брифинга ЦРУ о Тайване и TSMC - «Новости сети»
Суперсила, помноженная на два: в Японии IBM впервые смогла обеспечить бесшовную работу суперкомпьютера с квантовым - «Новости сети»
Суперсила, помноженная на два: в Японии IBM впервые смогла обеспечить бесшовную работу суперкомпьютера с квантовым - «Новости сети»
Что изменилось в Gemini Pro с обновлением до версии 3.1 - «Новости мира Интернет»
Что изменилось в Gemini Pro с обновлением до версии 3.1 - «Новости мира Интернет»
Новости мира Интернет » Новости » Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет»

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего.



По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте.



ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил.



Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно.



Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.


Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего. По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте. ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил. Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно. Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))