✔Alibaba выпустила открытую ИИ-модель Z-Image для генерации изображений - «Новости мира Интернет»
Alibaba представила Z-Image – открытую нейросеть для генерации картинок, которая привлекла внимание сообщества качеством изображений и умением работать с текстом. Компактная версия модели на 6 млрд параметров показывает результаты, сопоставимые с крупными системами наподобие Flux 2, хотя их архитектура в пять раз больше.
Z-Image доступна в нескольких вариантах. Сейчас опубликована версия Turbo – самая быстрая и легкая: она рассчитана на широкое использование. Позже компания выпустит два других варианта: Base с максимальными возможностями и Edit, предназначенную для редактирования существующих изображений. Код и веса Turbo уже можно скачать на GitHub или протестировать на HuggingFace. Для локального запуска потребуется видеокарта не менее чем на 16 ГБ.
Пользователи активно тестируют возможности модели – в соцсетях появляются примеры фотореалистичных пейзажей, городских видов и генераций достопримечательностей по текстовому описанию.
Z-Image уверенно работает с английским и китайским языками, частично справляется с русским, немецким, французским и испанским, хотя иногда допускает ошибки при создании надписей. Но на английском и китайском модель отличается высоким качеством генерации текста на изображениях – это навык, который обычно дается нейросетям с трудом. Сравнения, опубликованные пользователями, показывают, что Z-Image нередко выдает изображения уровня ведущих SOTA-моделей.
Alibaba планирует продолжать развивать проект: релиз версии Edit для редактирования изображений и расширенной Base намечен на ближайшее время.
