Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет» » Новости мира Интернет
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Google представила Gemma 4 12B – мультимодальную ИИ-модель для обычных ноутбуков - «Новости мира Интернет»
Google представила Gemma 4 12B – мультимодальную ИИ-модель для обычных ноутбуков - «Новости мира Интернет»
В Яндекс ID добавлен единый центр управления коммуникациями - «Новости мира Интернет»
В Яндекс ID добавлен единый центр управления коммуникациями - «Новости мира Интернет»
FromSoftware подтвердила дату выхода Elden Ring: Tarnished Edition для Nintendo Switch 2 и платное дополнение для других платформ - «Новости сети»
FromSoftware подтвердила дату выхода Elden Ring: Tarnished Edition для Nintendo Switch 2 и платное дополнение для других платформ - «Новости сети»
Anthropic предложила механизм экстренного торможения для развития ИИ - «Новости сети»
Anthropic предложила механизм экстренного торможения для развития ИИ - «Новости сети»
Google начала развёртывать Gemini Avatar — технологию, которая создаёт пугающе реалистичных цифровых двойников - «Новости сети»
Google начала развёртывать Gemini Avatar — технологию, которая создаёт пугающе реалистичных цифровых двойников - «Новости сети»
Астрологи в восторге: новый патч для Heroes of Might & Magic: Olden Era починил понедельники - «Новости сети»
Астрологи в восторге: новый патч для Heroes of Might & Magic: Olden Era починил понедельники - «Новости сети»
AMD отобрала у Intel треть рынка x86-процессоров, пока рынок настольных CPU рухнул на 20 % - «Новости сети»
AMD отобрала у Intel треть рынка x86-процессоров, пока рынок настольных CPU рухнул на 20 % - «Новости сети»
Новости мира Интернет » Новости » Microsoft разработал ИИ, имитирующий голос на основе трехсекундной записи - «Новости мира Интернет»

Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего.



По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте.



ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил.



Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно.



Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.


Корпорация Microsoft представила искусственный интеллект VALL-E, который может имитировать голос на основе трехсекундного образца. Технология позволяет воспроизвести любой голос, передавая при этом тон и эмоции говорящего. По мнению разработчиков, система может пригодиться при создании приложений для преобразования текста в речь или аудиоконтента. При этом она может использоваться в сочетании с другими ИИ-генераторами, вроде GPT-3. Послушать, как звучат сгенерированные отрывки, можно на этом сайте. ИИ обучали на основе модели с применением 60 тысяч часов записи англоязычной речи от более 7 тысяч человек. За счет этого системе достаточно прослушать запись, и она сможет генерировать речь даже с использованием тех слов, которых человек никогда не произносил. Данную разработку считают прорывом в области голосов, так как ранние программы могли только воспроизводить голос, не передавая эмоции и тон. Отмечается, что по мере совершенствования системы имитация также будет звучать еще более убедительно. Как пишет РБК, этот момент затрагивает ряд этических вопросов, так как технологией могут воспользоваться мошенники. По этой причине Microsoft пока не планирует размещать код VALL-E в публичном доступе. Программу продолжат разрабатывать и совершенствовать строго внутри компании.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))