DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет» » Новости мира Интернет
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Пользователь Reddit составил рейтинг наушников на основе отзывов - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
Telegram объявил о конкурсе на дизайн Telegram Nodes - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Microsoft представила коллекцию «уродливых» рождественских свитеров 2025 года - «Новости мира Интернет»
Что такое мониторинг работы сотрудников
Что такое мониторинг работы сотрудников
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
В Блокноте на Windows 11 добавили новые функции, в том числе поддержку таблиц - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Стартап Reetle представил чехол для iPhone с E-Ink-экраном и ИИ-функциями - «Новости мира Интернет»
Huawei представила беспроводной роутер X3 Pro с уникальным дизайном - «Новости мира Интернет»
Huawei представила беспроводной роутер X3 Pro с уникальным дизайном - «Новости мира Интернет»
OpenAI модернизировала голосовой режим ChatGPT: теперь он работает прямо в чате - «Новости мира Интернет»
OpenAI модернизировала голосовой режим ChatGPT: теперь он работает прямо в чате - «Новости мира Интернет»
Яндекс и исследователи из МГУ разработали метод обучения ИИ сложным правилам русского языка - «Новости мира Интернет»
Яндекс и исследователи из МГУ разработали метод обучения ИИ сложным правилам русского языка - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»

Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений.



V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5.



Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия.






Источник: DeepSeek



В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений.



Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений. V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5. Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия. Источник: DeepSeek В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений. Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.

Смотрите также

А что там на главной? )))



Комментарии )))