✔Anthropic выпустила Claude Opus 4.5 – нового лидера в решении инженерных и мультимодальных задач - «Новости мира Интернет»
Anthropic представила Claude Opus 4.5 и называет новинку своей лучшей моделью для программирования, агентных систем и мультимодальных задач.
По внутренним оценкам и внешним тестам Opus 4.5 вышел в лидеры среди современных ИИ: модель показывает высший результат на SWE-bench Verified и обходит Gemini 3 Pro и GPT-5.1 в ряде инженерных бенчмарков. В многоязычном SWE-bench Multilingual Opus 4.5 уверенно лидирует в 7 из 8 языков.
По сравнению с предыдущим поколением, изменились не только скорость и точность, но и поведение модели в многосоставных сценариях. Тестировщики отмечают, что Opus 4.5 лучше справляется с неопределенностью, умеет рассуждать о компромиссах и самостоятельно находит решения для комплексных ошибок. Например, в ситуационной задаче для авиационного агента модель придумала законный, но нестандартный обходной путь, который не был предусмотрен авторами теста.
Источник: Anthropic (здесь и на обложке)
А еще – стоимость Opus стала втрое меньше: теперь через API ввод стоит 5 долларов за миллион токенов, вывод – 25 долларов. Благодаря этому возможности уровня Opus стали доступны более широкой аудитории разработчиков и компаний.
Anthropic также усилила инструменты для разработчиков. В API появился параметр effort, позволяющий выбирать глубину размышлений – от быстрого ответа до тщательного анализа. На среднем уровне модель сравнима с Sonnet 4.5, но выдает на 76% меньше токенов, на максимальном – опережает предшественника более чем на 4 процентных пункта.
Opus 4.5 доступен в приложениях Claude, через API и в облаках AWS, Azure и Google Cloud. Обновления получили и продукты компании: это улучшенный Claude Code, поддержка длинных диалогов, инструменты для Excel, Chrome и настольных приложений.

