✔DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений.
V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5.
Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия.
Источник: DeepSeek
В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений.
Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.
