"Яндекс" запустил облачный сервис распознавания речи - «Интернет и связь»
Что нового показали на Google I/O 2026. Часть 2 - «Новости мира Интернет»
Что нового показали на Google I/O 2026. Часть 2 - «Новости мира Интернет»
Новый ИИ-агент Figma умеет создавать интерфейсы по текстовому запросу - «Новости мира Интернет»
Новый ИИ-агент Figma умеет создавать интерфейсы по текстовому запросу - «Новости мира Интернет»
Microsoft изменит работу клавиши Copilot в Windows 11 - «Новости мира Интернет»
Microsoft изменит работу клавиши Copilot в Windows 11 - «Новости мира Интернет»
Android добавит предупреждения для пользователей об удалении приложений из Google Play - «Новости мира Интернет»
Android добавит предупреждения для пользователей об удалении приложений из Google Play - «Новости мира Интернет»
Представлены AR-очки X By Xreal a01 с оптической стабилизацией и сменной оправой - «Новости мира Интернет»
Представлены AR-очки X By Xreal a01 с оптической стабилизацией и сменной оправой - «Новости мира Интернет»
Код, арт, звук: почему разработчикам игр не хватает коллабораций
Код, арт, звук: почему разработчикам игр не хватает коллабораций
CD Projekt Red в разгар слухов о третьем дополнении к The Witcher 3: Wild Hunt анонсировала юбилейный стрим по «Кровь и вино» - «Новости сети»
CD Projekt Red в разгар слухов о третьем дополнении к The Witcher 3: Wild Hunt анонсировала юбилейный стрим по «Кровь и вино» - «Новости сети»
«Бонд, которого мы заслужили»: шпионский боевик 007 First Light от создателей Hitman стартовал в Steam c «очень положительными» отзывами - «Новости сети»
«Бонд, которого мы заслужили»: шпионский боевик 007 First Light от создателей Hitman стартовал в Steam c «очень положительными» отзывами - «Новости сети»
Microsoft выпустила первое обновление, которое ускоряет Windows 11 - «Новости сети»
Microsoft выпустила первое обновление, которое ускоряет Windows 11 - «Новости сети»
Создание базы NASA на Луне начнётся с трёх миссий, которые состоятся в этом году - «Новости сети»
Создание базы NASA на Луне начнётся с трёх миссий, которые состоятся в этом году - «Новости сети»
Новости мира Интернет » Новости » Новости мира Интернет » "Яндекс" запустил облачный сервис распознавания речи - «Интернет и связь»
Компания "Яндекс" запустила облачный сервис распознавания речи SpeechKit Cloud, с помощью которого разработчики могут научить свои продукты понимать голос человека. Поддержку нового сервиса разработчики могут добавить в различные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.


В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую компания запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Короткие запросы система распознает с точностью 85%, геозапросы - с точностью 95%, диктовку текста - 82%. Для сравнения, человек распознает то, что он услышал, на 96-99%.
В основе технологии Yandex SpeechKit лежат акустические и языковые модели. Они построены с применением нейронных сетей, которые обучаются на больших массивах данных. Инфраструктура системы спроектирована таким образом, чтобы выдерживать высокие нагрузки. Система умеет распознавать короткие запросы любой тематики, геозапросы, диктовку коротких текстов. Yandex SpeechKit уже используется в мобильных продуктах компании. На его основе работают голосовые команды в "Яндекс.Навигаторе", голосовой поиск в "Яндекс.Картах", Поиске, "Яндекс.Браузере" и "Яндекс.Городе".
Компания открыла технологию для сторонних разработчиков в виде Yandex SpeechKit Моbile SDK и сервиса Yandex SpeechKit Cloud. С помощью мультиплатформенной библиотеки Yandex SpeechKit Mobile SDK разработчики мобильных приложений смогут внедрить голосовое управление, голосовой ввод текста или поиск по содержимому приложения. Это поможет сделать взаимодействие с приложением более удобным, к примеру, в ситуациях, когда у человека заняты руки.
Облачный сервис распознавания речи "Яндекса" уже используют компания Oktell, выпускающая программное обеспечение для колл-центров, и Cubic Robotics - разработчик домашнего робота CUBIC. Робот понимает заданные голосом вопросы и отвечает на них, а система Oktell распознает речь звонящего в колл-центр человека и соединяет его с нужным специалистом.
SpeechKit Cloud понимает русский и турецкий языки. Обработка голосовых запросов производится на серверах "Яндекса".
"Вообще в мире есть менее пяти компаний, которые умеют хорошо распознавать голос. Для русского языка таких компаний, по большому счету, две: американская Nuance и "Центр речевых технологий". Сейчас мы реализовали свое решение для русского и турецкого языков, которое отличается качеством и скоростью распознавания. Со временем мы будем добавлять поддержку других языков", - рассказал IT. Григорий Бакунов, директор по распространению технологий "Яндекса".
Разработчики могут бесплатно использовать SpeechKit Cloud в течение месяца. По окончании пробного периода стоимость будет зависеть от количества запросов.

Компания

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))