DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет» » Новости мира Интернет
В 2ГИС добавили статистику поездок и умный поиск по маршруту - «Новости мира Интернет»
В 2ГИС добавили статистику поездок и умный поиск по маршруту - «Новости мира Интернет»
Ученые из Токийского университета научились гладить виртуальных кошек - «Новости мира Интернет»
Ученые из Токийского университета научились гладить виртуальных кошек - «Новости мира Интернет»
Microsoft упрощает Edge и удаляет в нем ряд функций - «Новости мира Интернет»
Microsoft упрощает Edge и удаляет в нем ряд функций - «Новости мира Интернет»
Бывший глава iRobot представил робота-компаньона с эмоциональным интеллектом - «Новости мира Интернет»
Бывший глава iRobot представил робота-компаньона с эмоциональным интеллектом - «Новости мира Интернет»
ChatGPT получил новую базовую модель GPT-5.5 Instant - «Новости мира Интернет»
ChatGPT получил новую базовую модель GPT-5.5 Instant - «Новости мира Интернет»
Алиса AI: что нового в апреле - «Новости мира Интернет»
Алиса AI: что нового в апреле - «Новости мира Интернет»
Heroes of Might & Magic: Olden Era вышла в раннем доступе Steam — фанаты ждали этого 11 лет - «Новости сети»
Heroes of Might & Magic: Olden Era вышла в раннем доступе Steam — фанаты ждали этого 11 лет - «Новости сети»
Epic Games Store устроил раздачу Hogwarts Legacy в честь 25-летия кинофраншизы «Гарри Поттер» — россиян оставили без подарка - «Новости сети»
Epic Games Store устроил раздачу Hogwarts Legacy в честь 25-летия кинофраншизы «Гарри Поттер» — россиян оставили без подарка - «Новости сети»
«Сделано в Германии»: Volla представила защищённый смартфон Phone Plinius со съёмной батареей и парой ОС на выбор - «Новости сети»
«Сделано в Германии»: Volla представила защищённый смартфон Phone Plinius со съёмной батареей и парой ОС на выбор - «Новости сети»
Noctua объяснила, почему чёрные вентиляторы выходят позже стандартных бежево-коричневых - «Новости сети»
Noctua объяснила, почему чёрные вентиляторы выходят позже стандартных бежево-коричневых - «Новости сети»
Новости мира Интернет » Новости интернета » DeepSeek выпустила обновленные модели V3.2 и V3.2-Speciale с упором на продвинутые рассуждения - «Новости мира Интернет»

Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений.



V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5.



Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия.






Источник: DeepSeek



В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений.



Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.


Китайская компания DeepSeek выпустила новое поколение языковых моделей – V3.2 и флагманскую V3.2-Speciale. Обе версии умеют выстраивать сложные цепочки рассуждений. V3.2 выступает преемником экспериментальной сентябрьской версии и позиционируется как универсальная модель «на каждый день». Разработчики отмечают, что по качеству ответов и скорости она сопоставима с решениями уровня GPT-5. Speciale – более мощная версия для задач на логику и анализ. Эта модель показала лучшие результаты в тестах международного уровня в олимпиадной математике и информатике, а в свежем бенчмарке AIME превзошла Gemini 3.0 Pro и GPT-5 High. В рейтинге CodeForces её оценка почти совпадает с топовой нейросетью Google. При этом обычная V3.2 успешно конкурирует в агентных задачах благодаря отличному умению планировать действия. Источник: DeepSeek В основе обеих моделей лежит оптимизированная для работы с длинным контекстом архитектура DeepSeek Sparse Attention. Но есть и ограничения: обучение на меньших вычислительных мощностях привело к тому, что модели уступают конкурентам в широте фактических знаний, а Speciale расходует больше токенов, так как ее высокие результаты достигаются за счёт длинных цепочек рассуждений. Стандартная V3.2 уже работает в веб-версии, приложениях и через API. Модель Speciale временно доступна только по API и будет открыта до середины декабря 2025-го года без поддержки инструментов. Код и веса обеих моделей опубликованы на Hugging Face.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))