OpenAI выпустила голосовую модель с интеллектом уровня GPT-5 - «Новости мира Интернет» » Новости мира Интернет
Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет»
Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет»
Google научила Gemini 3.5 Flash управлять компьютером и мобильными приложениями - «Новости мира Интернет»
Google научила Gemini 3.5 Flash управлять компьютером и мобильными приложениями - «Новости мира Интернет»
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями - «Новости сети»
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями - «Новости сети»
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр - «Новости сети»
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр - «Новости сети»
Microsoft внезапно продлила поддержку Windows 10 ещё на год - «Новости сети»
Microsoft внезапно продлила поддержку Windows 10 ещё на год - «Новости сети»
ФАС рекомендовала российским операторам не рекламировать 5G, которого нет - «Новости сети»
ФАС рекомендовала российским операторам не рекламировать 5G, которого нет - «Новости сети»
Учёные создали пиксель, который научит дисплеи видеть - «Новости сети»
Учёные создали пиксель, который научит дисплеи видеть - «Новости сети»
Данные по часам в Мониторинге запросов — «Блог для вебмастеров»
Данные по часам в Мониторинге запросов — «Блог для вебмастеров»
Apple готовит крупное обновление: в линейке могут появиться складной iPhone, робот для дома и наушники с камерой - «Новости мира Интернет»
Apple готовит крупное обновление: в линейке могут появиться складной iPhone, робот для дома и наушники с камерой - «Новости мира Интернет»
Valve открыла предзаказы на Steam Machine и готовит SteamOS для обычных ПК - «Новости мира Интернет»
Valve открыла предзаказы на Steam Machine и готовит SteamOS для обычных ПК - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » OpenAI выпустила голосовую модель с интеллектом уровня GPT-5 - «Новости мира Интернет»

OpenAI анонсировала GPT-Realtime-2 – голосовую модель с рассуждениями на уровне GPT-5. Система позволяет создавать ИИ-ассистентов, которые могут выполнять сложные задачи в реальном времени: анализировать запросы, использовать внешние инструменты, переводить речь и вести длинный диалог.



В модели GPT-Realtime-2 появился встроенный режим рассуждений – благодаря нему она справляется с логическими задачами, математикой и сложными пользовательскими сценариями. В тесте Big Bench Audio новинка показала точность 96,6% против 81,4% у предыдущей версии. Еще система научилась объяснять свои действия во время работы: когда GPT-Realtime-2 занята, она не молчит, а сообщает, что проверяет календарь или ищет данные в интернете.



Контекстное окно бота увеличилось с 32 до 128 тысяч токенов, а разработчики теперь могут выбирать уровень глубины рассуждений – от минимального для простых запросов до xhigh для сложных многоэтапных диалогов.



Параллельно с GPT-Realtime-2 компания представила еще две модели: GPT-Realtime-Translate – для синхронного перевода речи более чем с 70 языков на 13 выходных языков, GPT-Realtime-Whisper – для потоковой транскрипции: текст появляется прямо во время разговора, а не после завершения фразы.



Новые инструменты уже тестируют крупные компании. Zillow использует GPT-Realtime-2 для голосового помощника в сфере недвижимости и сообщает о заметном росте точности диалогов. Deutsche Telekom проверяет возможности живого многоязычного общения, а Vimeo экспериментирует с синхронным переводом видеороликов во время воспроизведения.



Новые модели доступны через API для разработчиков. Позже OpenAI планирует интегрировать GPT-Realtime-2 и в ChatGPT.



Изображение на обложке: OpenAI


OpenAI анонсировала GPT-Realtime-2 – голосовую модель с рассуждениями на уровне GPT-5. Система позволяет создавать ИИ-ассистентов, которые могут выполнять сложные задачи в реальном времени: анализировать запросы, использовать внешние инструменты, переводить речь и вести длинный диалог. В модели GPT-Realtime-2 появился встроенный режим рассуждений – благодаря нему она справляется с логическими задачами, математикой и сложными пользовательскими сценариями. В тесте Big Bench Audio новинка показала точность 96,6% против 81,4% у предыдущей версии. Еще система научилась объяснять свои действия во время работы: когда GPT-Realtime-2 занята, она не молчит, а сообщает, что проверяет календарь или ищет данные в интернете. Контекстное окно бота увеличилось с 32 до 128 тысяч токенов, а разработчики теперь могут выбирать уровень глубины рассуждений – от минимального для простых запросов до xhigh для сложных многоэтапных диалогов. Параллельно с GPT-Realtime-2 компания представила еще две модели: GPT-Realtime-Translate – для синхронного перевода речи более чем с 70 языков на 13 выходных языков, GPT-Realtime-Whisper – для потоковой транскрипции: текст появляется прямо во время разговора, а не после завершения фразы. Новые инструменты уже тестируют крупные компании. Zillow использует GPT-Realtime-2 для голосового помощника в сфере недвижимости и сообщает о заметном росте точности диалогов. Deutsche Telekom проверяет возможности живого многоязычного общения, а Vimeo экспериментирует с синхронным переводом видеороликов во время воспроизведения. Новые модели доступны через API для разработчиков. Позже OpenAI планирует интегрировать GPT-Realtime-2 и в ChatGPT. Изображение на обложке: OpenAI

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))