Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»
Яндекс представил AI Search – технологию веб-поиска для корпоративных ИИ-агентов - «Новости мира Интернет»
Яндекс представил AI Search – технологию веб-поиска для корпоративных ИИ-агентов - «Новости мира Интернет»
В Android тестируют Call Reason – функцию для маркировки срочных звонков - «Новости мира Интернет»
В Android тестируют Call Reason – функцию для маркировки срочных звонков - «Новости мира Интернет»
Дайджест обновлений Яндекс Рекламы для специалистов по продвижению - «Новости мира Интернет»
Дайджест обновлений Яндекс Рекламы для специалистов по продвижению - «Новости мира Интернет»
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Что такое мониторинг работы сотрудников
Что такое мониторинг работы сотрудников
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Новости мира Интернет » Новости » Новости мира Интернет » Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»

Фото:
globallookpress.com
Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму.
Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google.
Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке.
Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Фото: globallookpress.com Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму. Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google. Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке. Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.

0

Смотрите также

А что там на главной? )))



Комментарии )))