✔Новая модель Images 2.0 от OpenAI научилась проверять корректность изображений - «Новости мира Интернет»
OpenAI представила Images 2.0 – модель создает картинку по запросу и способна анализировать задачу, уточнять детали и перепроверять результат.
Компания интегрировала в Images 2.0 логику reasoning-моделей. В соответствующем режиме она может обращаться к актуальной информации, генерировать сразу несколько вариантов изображения и оценивать их на соответствие запросу. Это приближает процесс к полноценной работе дизайнера.
Модель лучше следует инструкциям, корректно размещает объекты и справляется со сложными композициями – интерфейсами, инфографикой и сценами с большим количеством деталей. Текст внутри изображений теперь отображается четко, выглядит связным даже для языков с нелатинской письменностью.
Источник: OpenAI (здесь и на обложке)
Повысился и уровень реализма: Images 2.0 умеет добавлять мелкие несовершенства, благодаря которым изображения выглядят более естественно. Также нейросеть точнее передает стили – от кинематографичных кадров до пиксель-арта и манги.
При этом Images 2.0 пока не идеальна: она может ошибаться в задачах с высокой точностью построения – к примеру, при создании пошаговых инструкций или сложных геометрических деталей.
Images 2.0 уже доступна пользователям ChatGPT и Codex, а также через API. Режим рассуждения открыт для подписчиков платных тарифов.


