DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет» » Новости мира Интернет
«Mass Effect, которую мы заслужили»: геймплей грандиозного ролевого боевика Exodus от ветеранов BioWare впечатлил игроков - «Новости сети»
«Mass Effect, которую мы заслужили»: геймплей грандиозного ролевого боевика Exodus от ветеранов BioWare впечатлил игроков - «Новости сети»
Google «перестал кормить» сайты — трафик из поиска обрушился, а ИИ даёт меньше 1 % переходов - «Новости сети»
Google «перестал кормить» сайты — трафик из поиска обрушился, а ИИ даёт меньше 1 % переходов - «Новости сети»
Роскомнадзор снова заявил, что Telegram не исполняет российское законодательство - «Новости сети»
Роскомнадзор снова заявил, что Telegram не исполняет российское законодательство - «Новости сети»
SpaceX впервые провела огневые испытания новейшей версии ускорителя Super Heavy — такой долетит даже до Луны - «Новости сети»
SpaceX впервые провела огневые испытания новейшей версии ускорителя Super Heavy — такой долетит даже до Луны - «Новости сети»
Авторы «невзламываемого» шифрования на основе квантовой физики получили премию Тьюринга - «Новости сети»
Авторы «невзламываемого» шифрования на основе квантовой физики получили премию Тьюринга - «Новости сети»
Pixelpaw Labs представила Phase – мышь, которая превращается в геймпад - «Новости мира Интернет»
Pixelpaw Labs представила Phase – мышь, которая превращается в геймпад - «Новости мира Интернет»
12 лет неприступности: инженерный гений против безопасности Xbox One – представлен первый аппаратный взлом - «Новости мира Интернет»
12 лет неприступности: инженерный гений против безопасности Xbox One – представлен первый аппаратный взлом - «Новости мира Интернет»
Adobe добавила в Photoshop функцию для преобразования двухмерных объектов в 3D-модели - «Новости мира Интернет»
Adobe добавила в Photoshop функцию для преобразования двухмерных объектов в 3D-модели - «Новости мира Интернет»
Apple представила второе поколение полноразмерных наушников AirPods Max 2 - «Новости мира Интернет»
Apple представила второе поколение полноразмерных наушников AirPods Max 2 - «Новости мира Интернет»
Новая консоль Xbox Project Helix объединит игры для ПК и приставки - «Новости мира Интернет»
Новая консоль Xbox Project Helix объединит игры для ПК и приставки - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»

Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений.



V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5.



Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия.






Источник: DeepSeek



В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений.



Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.


Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений. V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5. Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия. Источник: DeepSeek В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений. Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))