Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»
Аналитики объяснили, почему эксклюзивы PlayStation продаются на ПК всё хуже и хуже - «Новости сети»
Аналитики объяснили, почему эксклюзивы PlayStation продаются на ПК всё хуже и хуже - «Новости сети»
Российские компании начали замораживать рекламу в Telegram после заявления ФАС - «Новости сети»
Российские компании начали замораживать рекламу в Telegram после заявления ФАС - «Новости сети»
Samsung собирается предложить пользователям смартфонов Galaxy инструмент для вайб-кодинга - «Новости сети»
Samsung собирается предложить пользователям смартфонов Galaxy инструмент для вайб-кодинга - «Новости сети»
Apple сообщила о прекращении производства сразу 15 продуктов - «Новости сети»
Apple сообщила о прекращении производства сразу 15 продуктов - «Новости сети»
Дефицит — это «просто чудесно», заявил глава Nvidia Дженсен Хуанг - «Новости сети»
Дефицит — это «просто чудесно», заявил глава Nvidia Дженсен Хуанг - «Новости сети»
YouTube приступает к показу обязательной к просмотру рекламы на телевизорах по всему миру - «Новости сети»
YouTube приступает к показу обязательной к просмотру рекламы на телевизорах по всему миру - «Новости сети»
«Первый достойный наследник Disco Elysium»: в Steam вышла фэнтезийная ролевая игра Esoteric Ebb, вдохновлённая Planescape: Torment - «Новости сети»
«Первый достойный наследник Disco Elysium»: в Steam вышла фэнтезийная ролевая игра Esoteric Ebb, вдохновлённая Planescape: Torment - «Новости сети»
Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства» - «Новости сети»
Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства» - «Новости сети»
«Первое хорошее обновление за три года»: легендарная CS:GO вернулась в Steam к радости фанатов - «Новости сети»
«Первое хорошее обновление за три года»: легендарная CS:GO вернулась в Steam к радости фанатов - «Новости сети»
Seagate приступила к массовым поставкам жёстких дисков семейства Mozaic 4+, обеспечивающих ёмкость до 44 Тбайт - «Новости сети»
Seagate приступила к массовым поставкам жёстких дисков семейства Mozaic 4+, обеспечивающих ёмкость до 44 Тбайт - «Новости сети»
Новости мира Интернет » Новости » Новости мира Интернет » Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»

Фото:
globallookpress.com
Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму.
Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google.
Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке.
Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.

Фото: globallookpress.com Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму. Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google. Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке. Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))