Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет» » Новости мира Интернет
Дизайнер создал флешку в стиле фирменной папки из macOS - «Новости мира Интернет»
Дизайнер создал флешку в стиле фирменной папки из macOS - «Новости мира Интернет»
Джек Дорси запустил офлайн-мессенджер Bitchat - «Новости мира Интернет»
Джек Дорси запустил офлайн-мессенджер Bitchat - «Новости мира Интернет»
В Gmail появился удобный способ отписки от рассылок - «Новости мира Интернет»
В Gmail появился удобный способ отписки от рассылок - «Новости мира Интернет»
Зона расширяется: GSC Game World наконец подтвердила релиз S.T.A.L.K.E.R. 2: Heart of Chornobyl на PS5 - «Новости сети»
Зона расширяется: GSC Game World наконец подтвердила релиз S.T.A.L.K.E.R. 2: Heart of Chornobyl на PS5 - «Новости сети»
Найт-Сити встречает новых гостей: Sony без предупреждения добавила Cyberpunk 2077 в каталог PS Plus - «Новости сети»
Найт-Сити встречает новых гостей: Sony без предупреждения добавила Cyberpunk 2077 в каталог PS Plus - «Новости сети»
Браузеры почти 1 млн пользователей превратились в скрытых ботов для скрапинга - «Новости сети»
Браузеры почти 1 млн пользователей превратились в скрытых ботов для скрапинга - «Новости сети»
Илон Маск представил мощнейшую ИИ-модель Grok 4 и подписку SuperGrok Heavy за $300 в месяц - «Новости сети»
Илон Маск представил мощнейшую ИИ-модель Grok 4 и подписку SuperGrok Heavy за $300 в месяц - «Новости сети»
В большинстве AMD Ryzen и EPYC обнаружена уязвимость TSA, позволяющая красть пароли и другие секретные данные - «Новости сети»
В большинстве AMD Ryzen и EPYC обнаружена уязвимость TSA, позволяющая красть пароли и другие секретные данные - «Новости сети»
Слухи: в разработке находится сразу несколько Fallout, включая ту, «что вы все ждёте» - «Новости сети»
Слухи: в разработке находится сразу несколько Fallout, включая ту, «что вы все ждёте» - «Новости сети»
Исследователи обнаружили опасный метод взлома Android через невидимый интерфейс - «Новости сети»
Исследователи обнаружили опасный метод взлома Android через невидимый интерфейс - «Новости сети»
Новости мира Интернет » Новости » Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет»

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего.



По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте.



ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил.



Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно.



Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего. По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте. ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил. Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно. Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

0

Смотрите также

А что там на главной? )))



Комментарии )))