DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет» » Новости мира Интернет
Хардкорный шутер Road to Vostok о выживании на границе Финляндии и России скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер - «Новости сети»
Хардкорный шутер Road to Vostok о выживании на границе Финляндии и России скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер - «Новости сети»
Google переполошила геймдев: выход ИИ-генератора миров Project Genie уронил акции крупнейших разработчиков - «Новости сети»
Google переполошила геймдев: выход ИИ-генератора миров Project Genie уронил акции крупнейших разработчиков - «Новости сети»
Уже три компании из Китая пробились в топ-20 крупнейших поставщиков оборудования для выпуска чипов - «Новости сети»
Уже три компании из Китая пробились в топ-20 крупнейших поставщиков оборудования для выпуска чипов - «Новости сети»
Качественные изображения Samsung Galaxy S26 и S26+ слили в Сеть до анонса - «Новости сети»
Качественные изображения Samsung Galaxy S26 и S26+ слили в Сеть до анонса - «Новости сети»
Финны начали варить пиво «на песке» — местная пивоварня установила песочный теплоаккумулятор - «Новости сети»
Финны начали варить пиво «на песке» — местная пивоварня установила песочный теплоаккумулятор - «Новости сети»
Gemini стал доступен в «Google картах» по всему миру для пеших и велосипедных прогулок - «Новости сети»
Gemini стал доступен в «Google картах» по всему миру для пеших и велосипедных прогулок - «Новости сети»
Капитализация Microsoft рухнула на $357 млрд после успешного отчёта и заявления гендира о популярности Copilot - «Новости сети»
Капитализация Microsoft рухнула на $357 млрд после успешного отчёта и заявления гендира о популярности Copilot - «Новости сети»
Чтобы не отвлекаться на чтение субтитров: для Stellar Blade вышла профессиональная русская озвучка - «Новости сети»
Чтобы не отвлекаться на чтение субтитров: для Stellar Blade вышла профессиональная русская озвучка - «Новости сети»
«Руки не держат, ноги дрожат»: атмосферный симулятор альпиниста Cairn оставил игроков и критиков в полном восторге - «Новости сети»
«Руки не держат, ноги дрожат»: атмосферный симулятор альпиниста Cairn оставил игроков и критиков в полном восторге - «Новости сети»
Выручка Apple взлетела почти на 16 % — iPhone принесли рекордные $85 млрд, несмотря на дефицит чипов - «Новости сети»
Выручка Apple взлетела почти на 16 % — iPhone принесли рекордные $85 млрд, несмотря на дефицит чипов - «Новости сети»
Новости мира Интернет » Новости интернета » DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»

Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений.



V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5.



Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия.






Источник: DeepSeek



В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений.



Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.


Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений. V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5. Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия. Источник: DeepSeek В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений. Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))