Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет» » Новости мира Интернет
«Дай ему завершить работу»: Anthropic попросила разработчиков не мешать Claude писать и проверять код - «Новости сети»
«Дай ему завершить работу»: Anthropic попросила разработчиков не мешать Claude писать и проверять код - «Новости сети»
Глава DeepMind спрогнозировал появление сильного искусственного интеллекта (AGI) к 2030 году - «Новости сети»
Глава DeepMind спрогнозировал появление сильного искусственного интеллекта (AGI) к 2030 году - «Новости сети»
SpaceX впервые запустила новейшую мегаракету Starship V3 — корабль потерял двигатель, но продолжил полёт - «Новости сети»
SpaceX впервые запустила новейшую мегаракету Starship V3 — корабль потерял двигатель, но продолжил полёт - «Новости сети»
Китайские контрактные производители чипов начали поднимать цены на услуги, чтобы урвать свой кусок ИИ-пирога - «Новости сети»
Китайские контрактные производители чипов начали поднимать цены на услуги, чтобы урвать свой кусок ИИ-пирога - «Новости сети»
Создан материал для «неисчерпаемой фляги» — он сам добывает воду из воздуха, пока светит Солнце - «Новости сети»
Создан материал для «неисчерпаемой фляги» — он сам добывает воду из воздуха, пока светит Солнце - «Новости сети»
Предзаказы Assassin’s Creed Black Flag Resynced оказались среди «самых сильных в истории франшизы» — Ubisoft рассчитывает на большой успех - «Новости сети»
Предзаказы Assassin’s Creed Black Flag Resynced оказались среди «самых сильных в истории франшизы» — Ubisoft рассчитывает на большой успех - «Новости сети»
На Каннском фестивале показали 95-минутный фильм, снятый с помощью ИИ за $500 000 и две недели - «Новости сети»
На Каннском фестивале показали 95-минутный фильм, снятый с помощью ИИ за $500 000 и две недели - «Новости сети»
Терпение Sony подошло к концу: Bungie анонсировала финальное обновление для Destiny 2 - «Новости сети»
Терпение Sony подошло к концу: Bungie анонсировала финальное обновление для Destiny 2 - «Новости сети»
Alibaba открыла для всех Qwen 3.7-Max — бесплатную флагманскую ИИ-модель, которая вышла на уровень Claude Opus 4.6 Max - «Новости сети»
Alibaba открыла для всех Qwen 3.7-Max — бесплатную флагманскую ИИ-модель, которая вышла на уровень Claude Opus 4.6 Max - «Новости сети»
Nvidia открестилась от GeForce: компания перестала отчитываться о продажах игровых видеокарт - «Новости сети»
Nvidia открестилась от GeForce: компания перестала отчитываться о продажах игровых видеокарт - «Новости сети»
Новости мира Интернет » Новости интернета » Вышла обновлённая ИИ-модель Qwen3.5-Omni - «Новости мира Интернет»

Alibaba представила новое поколение мультимодального Qwen3.5-Omni – модель может одновременно работать с текстом, изображениями, аудио, видео и отвечать в реальном времени текстом и голосом.



У модели увеличилось контекстное окно: теперь система может анализировать до 10 часов аудио или несколько минут видео за один запрос. Существенно расширилась и языковая поддержка: распознавание речи охватывает более 100 языков и диалектов.



Также модель научилась распознавать, когда пользователь действительно обращается к ней, и управлять голосом – менять темп, громкость и эмоциональную окраску. Дополнительно реализованы функции веб-поиска и вызова внешних инструментов прямо в процессе диалога. Большое внимание уделили качеству речи: технология ARIA синхронизирует текст и голос, устраняет типичные ошибки вроде проглатывания слов или некорректного произношения чисел.



Самая неожиданная часть обновления – опция Audio-Visual Vibe Coding. С ее помощью модель может анализировать запись экрана с голосовыми комментариями и на основе этого генерировать рабочий программный код даже без текстового запроса. По словам разработчиков, этот навык не закладывался напрямую и возник как побочный эффект масштабирования.



По ряду тестов новая версия превосходит Gemini – это касается, прежде всего, аудио-задач. Текстовые и визуальные возможности остались на уровне предыдущих моделей линейки.



Qwen3.5-Omni доступна в нескольких версиях и распространяется через API.


Alibaba представила новое поколение мультимодального Qwen3.5-Omni – модель может одновременно работать с текстом, изображениями, аудио, видео и отвечать в реальном времени текстом и голосом. У модели увеличилось контекстное окно: теперь система может анализировать до 10 часов аудио или несколько минут видео за один запрос. Существенно расширилась и языковая поддержка: распознавание речи охватывает более 100 языков и диалектов. Также модель научилась распознавать, когда пользователь действительно обращается к ней, и управлять голосом – менять темп, громкость и эмоциональную окраску. Дополнительно реализованы функции веб-поиска и вызова внешних инструментов прямо в процессе диалога. Большое внимание уделили качеству речи: технология ARIA синхронизирует текст и голос, устраняет типичные ошибки вроде проглатывания слов или некорректного произношения чисел. Самая неожиданная часть обновления – опция Audio-Visual Vibe Coding. С ее помощью модель может анализировать запись экрана с голосовыми комментариями и на основе этого генерировать рабочий программный код даже без текстового запроса. По словам разработчиков, этот навык не закладывался напрямую и возник как побочный эффект масштабирования. По ряду тестов новая версия превосходит Gemini – это касается, прежде всего, аудио-задач. Текстовые и визуальные возможности остались на уровне предыдущих моделей линейки. Qwen3.5-Omni доступна в нескольких версиях и распространяется через API.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

запостил(а)
Mason
Вернуться назад
0

Смотрите также

А что там на главной? )))



Комментарии )))