Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»
Студия ветерана Blizzard анонсировала динамичный изометрический боевик Arkheron — смесь Diablo и королевской битвы - «Новости сети»
Студия ветерана Blizzard анонсировала динамичный изометрический боевик Arkheron — смесь Diablo и королевской битвы - «Новости сети»
Что значит сухой глаз у человека?
Что значит сухой глаз у человека?
В камерах iPhone 17 Pro Max и iPhone Air нашёлся баг — некоторые фото получаются испорченными - «Новости сети»
В камерах iPhone 17 Pro Max и iPhone Air нашёлся баг — некоторые фото получаются испорченными - «Новости сети»
Умное кольцо Sber после череды задержек ожидается в продаже с 24 сентября - «Новости сети»
Умное кольцо Sber после череды задержек ожидается в продаже с 24 сентября - «Новости сети»
Российский специалист по ремонту ПК-оборудования VIK-on выпустил DDR5-тестер для ноутбуков - «Новости сети»
Российский специалист по ремонту ПК-оборудования VIK-on выпустил DDR5-тестер для ноутбуков - «Новости сети»
Сегодня утром недалеко от Земли пролетит огромный астероид 2025 FA22, и за ним можно понаблюдать онлайн - «Новости сети»
Сегодня утром недалеко от Земли пролетит огромный астероид 2025 FA22, и за ним можно понаблюдать онлайн - «Новости сети»
Rockstar назвала GTA VI «крупнейшим игровым запуском в истории» за восемь месяцев до запуска игры - «Новости сети»
Rockstar назвала GTA VI «крупнейшим игровым запуском в истории» за восемь месяцев до запуска игры - «Новости сети»
Вышла iOS 26 с дизайном «Жидкое стекло» и новыми функциями Apple Intelligence — обновление уже доступно - «Новости сети»
Вышла iOS 26 с дизайном «Жидкое стекло» и новыми функциями Apple Intelligence — обновление уже доступно - «Новости сети»
Apple выпустила обновление iOS 18.7 для тех, кто не хочет ставить iOS 26 - «Новости сети»
Apple выпустила обновление iOS 18.7 для тех, кто не хочет ставить iOS 26 - «Новости сети»
ИТ-холдинг Fplus оказался на грани банкротства — претензии почти на 1 млрд руб. есть уже у трёх банков - «Новости сети»
ИТ-холдинг Fplus оказался на грани банкротства — претензии почти на 1 млрд руб. есть уже у трёх банков - «Новости сети»
Новости мира Интернет » Новости » Новости мира Интернет » Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»

Фото:
globallookpress.com
Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму.
Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google.
Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке.
Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Фото: globallookpress.com Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму. Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google. Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке. Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.

0

Смотрите также

А что там на главной? )))



Комментарии )))