Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»
Вышел Wine 11 — запуск Windows-приложений и игр в Linux и macOS стал почти «родным» - «Новости сети»
Вышел Wine 11 — запуск Windows-приложений и игр в Linux и macOS стал почти «родным» - «Новости сети»
Глава Google DeepMind считает, что китайские разработчики ИИ-моделей отстают от американских лишь на несколько месяцев - «Новости сети»
Глава Google DeepMind считает, что китайские разработчики ИИ-моделей отстают от американских лишь на несколько месяцев - «Новости сети»
Две игры в одной: Capcom показала геймплей Resident Evil Requiem за Грейс и Леона - «Новости сети»
Две игры в одной: Capcom показала геймплей Resident Evil Requiem за Грейс и Леона - «Новости сети»
Nvidia настаивает, что сокращений в номенклатуре GeForce RTX 50 нет, но есть проблемы с поставками - «Новости сети»
Nvidia настаивает, что сокращений в номенклатуре GeForce RTX 50 нет, но есть проблемы с поставками - «Новости сети»
США вслед за Россией и Китаем пообещали построить атомную электростанцию на Луне - «Новости сети»
США вслед за Россией и Китаем пообещали построить атомную электростанцию на Луне - «Новости сети»
Apple выбрала Gemini в качестве основы для новой Siri - «Новости мира Интернет»
Apple выбрала Gemini в качестве основы для новой Siri - «Новости мира Интернет»
Apple представила платформу Creator Studio с коллекцией приложений для творчества - «Новости мира Интернет»
Apple представила платформу Creator Studio с коллекцией приложений для творчества - «Новости мира Интернет»
Google научила Veo создавать вертикальные видео в 4K для мобильных платформ - «Новости мира Интернет»
Google научила Veo создавать вертикальные видео в 4K для мобильных платформ - «Новости мира Интернет»
NVIDIA добавила поддержку DLSS 4.5 Super Resolution во все видеокарты GeForce RTX - «Новости мира Интернет»
NVIDIA добавила поддержку DLSS 4.5 Super Resolution во все видеокарты GeForce RTX - «Новости мира Интернет»
Spigen выпустила ретро-чехол для iPhone 17 Pro в стиле классического Macintosh - «Новости мира Интернет»
Spigen выпустила ретро-чехол для iPhone 17 Pro в стиле классического Macintosh - «Новости мира Интернет»
Новости мира Интернет » Новости » Новости мира Интернет » Переводчик Google научился имитировать речь пользователя&nbsp - «Интернет»

Фото:
globallookpress.com
Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму.
Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google.
Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке.
Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Фото: globallookpress.com Разработанная компанией нейросеть принимает голосовой ввод, обрабатывает его как спектрограмму. Американская компания Google разработала алгоритм, который может напрямую переводить речь на другой язык, не используя текстовое представления и сохраняя голосовые данные и темп речи говорящего. Об этом сказано в блоге Google. Компания отказалась от перевода речи в текст в Google Translate, а после чего озвучивания ее, так как это зачастую приводит к ошибкам при переводе. Теперь речь говорящего сразу будет переводиться с одного на другой язык. Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектограмму на целевом языке. Разработчикам Google Translate удалось добиться того, что удалось сохранить оригинальный голос говорящего даже в переведенной речи. В настоящее время они «учат» алгоритм понимать векторное представление слов на обоих языках, а также грамматически верным формам и сочетаниям на большом примере.

0

Смотрите также

А что там на главной? )))



Комментарии )))