Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет» » Новости мира Интернет
Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет»
Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет»
Обновления в интерфейсе Sape: подсказки в фильтрах, ссылки без ожиданий и оценка качества размещений - «Новости мира Интернет»
Обновления в интерфейсе Sape: подсказки в фильтрах, ссылки без ожиданий и оценка качества размещений - «Новости мира Интернет»
Google анонсировала доступную модель для генерации видео Veo 3.1 Lite - «Новости мира Интернет»
Google анонсировала доступную модель для генерации видео Veo 3.1 Lite - «Новости мира Интернет»
Яндекс запустил Stackland – платформу для разработки в закрытом контуре - «Новости мира Интернет»
Яндекс запустил Stackland – платформу для разработки в закрытом контуре - «Новости мира Интернет»
Sape упростила управление статейными ссылками: изображения, статусы и переписка в одном окне - «Новости мира Интернет»
Sape упростила управление статейными ссылками: изображения, статусы и переписка в одном окне - «Новости мира Интернет»
LG Display планирует массовое производство экранов для ноутбуков с частотой от 1 до 120 Гц - «Новости мира Интернет»
LG Display планирует массовое производство экранов для ноутбуков с частотой от 1 до 120 Гц - «Новости мира Интернет»
Поиск в Windows 11 ждет крупное обновление после критики пользователей - «Новости мира Интернет»
Поиск в Windows 11 ждет крупное обновление после критики пользователей - «Новости мира Интернет»
Suno выпустила модель v5.5 с функцией генерации песен своим голосом - «Новости мира Интернет»
Suno выпустила модель v5.5 с функцией генерации песен своим голосом - «Новости мира Интернет»
xAI покинул последний из сооснователей, остался только сам Илон Маск - «Новости сети»
xAI покинул последний из сооснователей, остался только сам Илон Маск - «Новости сети»
Годовая прибыль BYD упала впервые за четыре года, обнажив ужасы ценовой войны в Китае - «Новости сети»
Годовая прибыль BYD упала впервые за четыре года, обнажив ужасы ценовой войны в Китае - «Новости сети»
Новости мира Интернет » Новости интернета » Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет»

Alibaba представила новое поколение мультимодального Qwen3.5-Omni – модель может одновременно работать с текстом, изображениями, аудио, видео и отвечать в реальном времени текстом и голосом.



У модели увеличилось контекстное окно: теперь система может анализировать до 10 часов аудио или несколько минут видео за один запрос. Существенно расширилась и языковая поддержка: распознавание речи охватывает более 100 языков и диалектов.



Также модель научилась распознавать, когда пользователь действительно обращается к ней, и управлять голосом – менять темп, громкость и эмоциональную окраску. Дополнительно реализованы функции веб-поиска и вызова внешних инструментов прямо в процессе диалога. Большое внимание уделили качеству речи: технология ARIA синхронизирует текст и голос, устраняет типичные ошибки вроде проглатывания слов или некорректного произношения чисел.



Самая неожиданная часть обновления – опция Audio-Visual Vibe Coding. С ее помощью модель может анализировать запись экрана с голосовыми комментариями и на основе этого генерировать рабочий программный код даже без текстового запроса. По словам разработчиков, этот навык не закладывался напрямую и возник как побочный эффект масштабирования.



По ряду тестов новая версия превосходит Gemini – это касается, прежде всего, аудио-задач. Текстовые и визуальные возможности остались на уровне предыдущих моделей линейки.



Qwen3.5-Omni доступна в нескольких версиях и распространяется через API.


Alibaba представила новое поколение мультимодального Qwen3.5-Omni – модель может одновременно работать с текстом, изображениями, аудио, видео и отвечать в реальном времени текстом и голосом. У модели увеличилось контекстное окно: теперь система может анализировать до 10 часов аудио или несколько минут видео за один запрос. Существенно расширилась и языковая поддержка: распознавание речи охватывает более 100 языков и диалектов. Также модель научилась распознавать, когда пользователь действительно обращается к ней, и управлять голосом – менять темп, громкость и эмоциональную окраску. Дополнительно реализованы функции веб-поиска и вызова внешних инструментов прямо в процессе диалога. Большое внимание уделили качеству речи: технология ARIA синхронизирует текст и голос, устраняет типичные ошибки вроде проглатывания слов или некорректного произношения чисел. Самая неожиданная часть обновления – опция Audio-Visual Vibe Coding. С ее помощью модель может анализировать запись экрана с голосовыми комментариями и на основе этого генерировать рабочий программный код даже без текстового запроса. По словам разработчиков, этот навык не закладывался напрямую и возник как побочный эффект масштабирования. По ряду тестов новая версия превосходит Gemini – это касается, прежде всего, аудио-задач. Текстовые и визуальные возможности остались на уровне предыдущих моделей линейки. Qwen3.5-Omni доступна в нескольких версиях и распространяется через API.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

запостил(а)
Mason
Вернуться назад
0

Смотрите также

А что там на главной? )))



Комментарии )))