Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет» » Новости мира Интернет
Управляйте продвижением в мобильном приложении Директа — «Блог для вебмастеров»
Управляйте продвижением в мобильном приложении Директа — «Блог для вебмастеров»
Китайские разработчики ИИ признают, что в ближайшие несколько лет им вряд ли удастся опередить США - «Новости сети»
Китайские разработчики ИИ признают, что в ближайшие несколько лет им вряд ли удастся опередить США - «Новости сети»
Google представила универсальный протокол UCP для организации покупок через чат-боты - «Новости сети»
Google представила универсальный протокол UCP для организации покупок через чат-боты - «Новости сети»
«Эта игра будет жить вечно»: фанатов The Witcher 3: Wild Hunt заворожила демонстрация амбициозного мода HD Reworked Project NextGen Edition 2026 - «Новости сети»
«Эта игра будет жить вечно»: фанатов The Witcher 3: Wild Hunt заворожила демонстрация амбициозного мода HD Reworked Project NextGen Edition 2026 - «Новости сети»
MSI выпустит сразу три версии сверхмощной GeForce RTX 5090 Lightning: X, Z и OCER — последняя в открытой продаже не появится - «Новости сети»
MSI выпустит сразу три версии сверхмощной GeForce RTX 5090 Lightning: X, Z и OCER — последняя в открытой продаже не появится - «Новости сети»
Власти Индии собираются требовать от производителей смартфонов раскрывать исходный программный код - «Новости сети»
Власти Индии собираются требовать от производителей смартфонов раскрывать исходный программный код - «Новости сети»
Larian ответила на вопросы игроков о Divinity и генеративном ИИ в разработке — новые подробности амбициозной RPG от создателей Baldur’s Gate 3 - «Новости сети»
Larian ответила на вопросы игроков о Divinity и генеративном ИИ в разработке — новые подробности амбициозной RPG от создателей Baldur’s Gate 3 - «Новости сети»
«Думал, быстрее умру, чем дождусь её»: спустя семь лет после «Мора» в Steam вышла Pathologic 3 - «Новости сети»
«Думал, быстрее умру, чем дождусь её»: спустя семь лет после «Мора» в Steam вышла Pathologic 3 - «Новости сети»
«Sea of Thieves, но в пустыне»: трейлер эвакуационного шутера Sand: Raiders of Sophie понравился игрокам - «Новости сети»
«Sea of Thieves, но в пустыне»: трейлер эвакуационного шутера Sand: Raiders of Sophie понравился игрокам - «Новости сети»
Учёные нашли способ превращения испорченного молока в материал для 3D-печати - «Новости сети»
Учёные нашли способ превращения испорченного молока в материал для 3D-печати - «Новости сети»
Новости мира Интернет » Новости » Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет»

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего.



По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте.



ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил.



Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно.



Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего. По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте. ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил. Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно. Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

0

Смотрите также

А что там на главной? )))



Комментарии )))