✔Anthropic создали нейросеть Claude Sonnet 4.5 для программирования и решения сложных задач - «Новости мира Интернет»
Компания Anthropic разработала мощную языковую модель Claude Sonnet 4.5, ориентированную на программирование, решение сложных задач и создание ИИ-агентов. По итогам тестирования в профильных бенчмарках, ИИ демонстрирует значительный скачок в понимании программного кода, математических вычислениях и управлении компьютером.
Нейросеть Claude Sonnet 4.5 заняла первую строчку в отраслевом тесте SWE-bench Verified, измеряющем способности ИИ-моделей к написанию и анализу программного кода. Как сообщают разработчики, новинка может поддерживать концентрацию более 30 часов при работе над многоэтапными задачами, обходя предыдущие версии Claude и ближайших конкурентов.
Источник (здесь, далее и на обложке): Anthropic
В тесте OSWorld, проверяющем выполнение искусственным интеллектом реальных компьютерных задач, Sonnet 4.5 показал результат 61,4 % против 42,2 % у версии Sonnet 4.
Помимо этого, разработчики проводили внутренние независимые тесты, по итогам которых Sonnet 4.5 демонстрирует серьезный прогресс в задачах логического вывода и математики, а также в ряде специализированных областей, включая финансы, медицину, право и STEM-дисциплины.
Был добавлен экспериментальный режим Imagine with Claude. В его рамках ИИ может создавать программные решения за короткий срок, адаптируя код под текущие запросы пользователя.
В Claude Sonnet 4.5 снизили число опасных и нежелательных паттернов поведения, такие как подыгрывание пользователю, попытки обойти ограничения или выполнение вредных запросов. Для защиты пользователей Anthropic применяет многоуровневые фильтры (AI Safety Level 3), особенно в отношении тем, связанных с химическими, биологическими, ядерными и другими видами оружия.
С выпуском Sonnet 4.5 представлены и крупные обновления экосистемы Claude. В сервисе Claude Code появились чекпоинты для сохранения прогресса, обновленный терминал и расширение для Visual Studio Code. В приложениях Claude можно работать с кодом, создавать таблицы, презентации или документы прямо в диалоге, а пользователи с подпиской Max получили расширение для Chrome.
Для разработчиков добавили набор инструментов Claude Agent SDK. С его помощью можно создавать собственных ИИ-агентов на базе тех же технологий, что лежат в основе Claude Code. SDK реализует сложную работу с памятью, управлением правами и координацией подзадач между агентами, позволяя создавать продвинутые решения под любые задачи.
Протестировать новинку можно через веб-версию чат-бота, а также в мобильных приложениях на iOS и Android. Также ИИ-модель доступна по API, стоимость ее использования – от 3 долларов за миллион токенов. Новые возможности Claude Code и Agent SDK доступны всем разработчикам и корпоративным клиентам.