✔Anthropic выпустила Claude Opus 4.5 – нового лидера в решении инженерных и мультимодальных задач - «Новости мира Интернет»

26 ноября 2025 73 Новости интернета 0

Anthropic представила Claude Opus 4.5 и называет новинку своей лучшей моделью для программирования, агентных систем и мультимодальных задач.

По внутренним оценкам и внешним тестам Opus 4.5 вышел в лидеры среди современных ИИ: модель показывает высший результат на SWE-bench Verified и обходит Gemini 3 Pro и GPT-5.1 в ряде инженерных бенчмарков. В многоязычном SWE-bench Multilingual Opus 4.5 уверенно лидирует в 7 из 8 языков.

По сравнению с предыдущим поколением, изменились не только скорость и точность, но и поведение модели в многосоставных сценариях. Тестировщики отмечают, что Opus 4.5 лучше справляется с неопределенностью, умеет рассуждать о компромиссах и самостоятельно находит решения для комплексных ошибок. Например, в ситуационной задаче для авиационного агента модель придумала законный, но нестандартный обходной путь, который не был предусмотрен авторами теста.

Источник: Anthropic (здесь и на обложке)

А еще – стоимость Opus стала втрое меньше: теперь через API ввод стоит 5 долларов за миллион токенов, вывод – 25 долларов. Благодаря этому возможности уровня Opus стали доступны более широкой аудитории разработчиков и компаний.

Anthropic также усилила инструменты для разработчиков. В API появился параметр effort, позволяющий выбирать глубину размышлений – от быстрого ответа до тщательного анализа. На среднем уровне модель сравнима с Sonnet 4.5, но выдает на 76% меньше токенов, на максимальном – опережает предшественника более чем на 4 процентных пункта.

Opus 4.5 доступен в приложениях Claude, через API и в облаках AWS, Azure и Google Cloud. Обновления получили и продукты компании: это улучшенный Claude Code, поддержка длинных диалогов, инструменты для Excel, Chrome и настольных приложений.

Anthropic представила Claude Opus 4.5 и называет новинку своей лучшей моделью для программирования, агентных систем и мультимодальных задач. По внутренним оценкам и внешним тестам Opus 4.5 вышел в лидеры среди современных ИИ: модель показывает высший результат на SWE-bench Verified и обходит Gemini 3 Pro и GPT-5.1 в ряде инженерных бенчмарков. В многоязычном SWE-bench Multilingual Opus 4.5 уверенно лидирует в 7 из 8 языков. По сравнению с предыдущим поколением, изменились не только скорость и точность, но и поведение модели в многосоставных сценариях. Тестировщики отмечают, что Opus 4.5 лучше справляется с неопределенностью, умеет рассуждать о компромиссах и самостоятельно находит решения для комплексных ошибок. Например, в ситуационной задаче для авиационного агента модель придумала законный, но нестандартный обходной путь, который не был предусмотрен авторами теста. Источник: Anthropic (здесь и на обложке) А еще – стоимость Opus стала втрое меньше: теперь через API ввод стоит 5 долларов за миллион токенов, вывод – 25 долларов. Благодаря этому возможности уровня Opus стали доступны более широкой аудитории разработчиков и компаний. Anthropic также усилила инструменты для разработчиков. В API появился параметр effort, позволяющий выбирать глубину размышлений – от быстрого ответа до тщательного анализа. На среднем уровне модель сравнима с Sonnet 4.5, но выдает на 76% меньше токенов, на максимальном – опережает предшественника более чем на 4 процентных пункта. Opus 4.5 доступен в приложениях Claude, через API и в облаках AWS, Azure и Google Cloud. Обновления получили и продукты компании: это улучшенный Claude Code, поддержка длинных диалогов, инструменты для Excel, Chrome и настольных приложений.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.

Иллюстрация к статье - Яндекс. Картинки.

Есть вопросы. Напишите нам.

Общие правила поведения на сайте.