"Яндекс" запустил облачный сервис распознавания речи - «Интернет и связь»
Larian ответила на вопросы игроков о Divinity и генеративном ИИ в разработке — новые подробности амбициозной RPG от создателей Baldur’s Gate 3 - «Новости сети»
Larian ответила на вопросы игроков о Divinity и генеративном ИИ в разработке — новые подробности амбициозной RPG от создателей Baldur’s Gate 3 - «Новости сети»
«Думал, быстрее умру, чем дождусь её»: спустя семь лет после «Мора» в Steam вышла Pathologic 3 - «Новости сети»
«Думал, быстрее умру, чем дождусь её»: спустя семь лет после «Мора» в Steam вышла Pathologic 3 - «Новости сети»
«Sea of Thieves, но в пустыне»: трейлер эвакуационного шутера Sand: Raiders of Sophie понравился игрокам - «Новости сети»
«Sea of Thieves, но в пустыне»: трейлер эвакуационного шутера Sand: Raiders of Sophie понравился игрокам - «Новости сети»
Учёные нашли способ превращения испорченного молока в материал для 3D-печати - «Новости сети»
Учёные нашли способ превращения испорченного молока в материал для 3D-печати - «Новости сети»
Adata и MSI показали «первые в мире» 4-ранговые модули памяти DDR5 CUDIMM на 128 Гбайт - «Новости сети»
Adata и MSI показали «первые в мире» 4-ранговые модули памяти DDR5 CUDIMM на 128 Гбайт - «Новости сети»
Спустя восемь лет после Wolfenstein 2: The New Colossus студия MachineGames взялась за Wolfenstein 3 — разработку подтвердил ещё один источник - «Новости сети»
Спустя восемь лет после Wolfenstein 2: The New Colossus студия MachineGames взялась за Wolfenstein 3 — разработку подтвердил ещё один источник - «Новости сети»
Micron на следующей неделе заложит фундамент крупнейшего комплекса по производству памяти в США - «Новости сети»
Micron на следующей неделе заложит фундамент крупнейшего комплекса по производству памяти в США - «Новости сети»
Власти потребовали от китайских компаний отменить заказы на американские ускорители Nvidia H200 - «Новости сети»
Власти потребовали от китайских компаний отменить заказы на американские ускорители Nvidia H200 - «Новости сети»
Sony анонсировала лимитированную коллекцию ярких RGB-чехлов для PlayStation 5 - «Новости сети»
Sony анонсировала лимитированную коллекцию ярких RGB-чехлов для PlayStation 5 - «Новости сети»
Блоки питания MSI получили звуковую защиту от плавления разъёма 12V-2×6 - «Новости сети»
Блоки питания MSI получили звуковую защиту от плавления разъёма 12V-2×6 - «Новости сети»
Новости мира Интернет » Новости » Новости мира Интернет » "Яндекс" запустил облачный сервис распознавания речи - «Интернет и связь»
Компания "Яндекс" запустила облачный сервис распознавания речи SpeechKit Cloud, с помощью которого разработчики могут научить свои продукты понимать голос человека. Поддержку нового сервиса разработчики могут добавить в различные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.


В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую компания запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Короткие запросы система распознает с точностью 85%, геозапросы - с точностью 95%, диктовку текста - 82%. Для сравнения, человек распознает то, что он услышал, на 96-99%.
В основе технологии Yandex SpeechKit лежат акустические и языковые модели. Они построены с применением нейронных сетей, которые обучаются на больших массивах данных. Инфраструктура системы спроектирована таким образом, чтобы выдерживать высокие нагрузки. Система умеет распознавать короткие запросы любой тематики, геозапросы, диктовку коротких текстов. Yandex SpeechKit уже используется в мобильных продуктах компании. На его основе работают голосовые команды в "Яндекс.Навигаторе", голосовой поиск в "Яндекс.Картах", Поиске, "Яндекс.Браузере" и "Яндекс.Городе".
Компания открыла технологию для сторонних разработчиков в виде Yandex SpeechKit Моbile SDK и сервиса Yandex SpeechKit Cloud. С помощью мультиплатформенной библиотеки Yandex SpeechKit Mobile SDK разработчики мобильных приложений смогут внедрить голосовое управление, голосовой ввод текста или поиск по содержимому приложения. Это поможет сделать взаимодействие с приложением более удобным, к примеру, в ситуациях, когда у человека заняты руки.
Облачный сервис распознавания речи "Яндекса" уже используют компания Oktell, выпускающая программное обеспечение для колл-центров, и Cubic Robotics - разработчик домашнего робота CUBIC. Робот понимает заданные голосом вопросы и отвечает на них, а система Oktell распознает речь звонящего в колл-центр человека и соединяет его с нужным специалистом.
SpeechKit Cloud понимает русский и турецкий языки. Обработка голосовых запросов производится на серверах "Яндекса".
"Вообще в мире есть менее пяти компаний, которые умеют хорошо распознавать голос. Для русского языка таких компаний, по большому счету, две: американская Nuance и "Центр речевых технологий". Сейчас мы реализовали свое решение для русского и турецкого языков, которое отличается качеством и скоростью распознавания. Со временем мы будем добавлять поддержку других языков", - рассказал IT. Григорий Бакунов, директор по распространению технологий "Яндекса".
Разработчики могут бесплатно использовать SpeechKit Cloud в течение месяца. По окончании пробного периода стоимость будет зависеть от количества запросов.
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Компания

0

Смотрите также

А что там на главной? )))



Комментарии )))