Apple представила модель искусственного интеллекта MGIE для редактирования фото - «Новости мира Интернет» » Новости мира Интернет
Apple выбрала Gemini в качестве основы для новой Siri - «Новости мира Интернет»
Apple выбрала Gemini в качестве основы для новой Siri - «Новости мира Интернет»
Apple представила платформу Creator Studio с коллекцией приложений для творчества - «Новости мира Интернет»
Apple представила платформу Creator Studio с коллекцией приложений для творчества - «Новости мира Интернет»
Google научила Veo создавать вертикальные видео в 4K для мобильных платформ - «Новости мира Интернет»
Google научила Veo создавать вертикальные видео в 4K для мобильных платформ - «Новости мира Интернет»
NVIDIA добавила поддержку DLSS 4.5 Super Resolution во все видеокарты GeForce RTX - «Новости мира Интернет»
NVIDIA добавила поддержку DLSS 4.5 Super Resolution во все видеокарты GeForce RTX - «Новости мира Интернет»
Spigen выпустила ретро-чехол для iPhone 17 Pro в стиле классического Macintosh - «Новости мира Интернет»
Spigen выпустила ретро-чехол для iPhone 17 Pro в стиле классического Macintosh - «Новости мира Интернет»
Управляйте продвижением в мобильном приложении Директа — «Блог для вебмастеров»
Управляйте продвижением в мобильном приложении Директа — «Блог для вебмастеров»
Китайские разработчики ИИ признают, что в ближайшие несколько лет им вряд ли удастся опередить США - «Новости сети»
Китайские разработчики ИИ признают, что в ближайшие несколько лет им вряд ли удастся опередить США - «Новости сети»
Google представила универсальный протокол UCP для организации покупок через чат-боты - «Новости сети»
Google представила универсальный протокол UCP для организации покупок через чат-боты - «Новости сети»
«Эта игра будет жить вечно»: фанатов The Witcher 3: Wild Hunt заворожила демонстрация амбициозного мода HD Reworked Project NextGen Edition 2026 - «Новости сети»
«Эта игра будет жить вечно»: фанатов The Witcher 3: Wild Hunt заворожила демонстрация амбициозного мода HD Reworked Project NextGen Edition 2026 - «Новости сети»
MSI выпустит сразу три версии сверхмощной GeForce RTX 5090 Lightning: X, Z и OCER — последняя в открытой продаже не появится - «Новости сети»
MSI выпустит сразу три версии сверхмощной GeForce RTX 5090 Lightning: X, Z и OCER — последняя в открытой продаже не появится - «Новости сети»
Новости мира Интернет » Новости » Apple представила модель искусственного интеллекта MGIE для редактирования фото - «Новости мира Интернет»

Apple в сотрудничестве с Калифорнийским университетом выпустила новую модель искусственного интеллекта MGIE (MLLM-Guided Image Editing) с открытым исходным кодом. С ее помощью можно редактировать фотографии, задавая для этого текстовые команды.



Как пишет Rozetked, для интерпретации пользовательских команд и их выполнения используются мультимодальные большие языковые модели (MLLM). То есть при редактировании одновременно нейросеть может как распознавать объекты на изображении, так и понимать текстовые запросы.



Благодаря такому решению изображение можно менять локально и глобально. К примеру, есть возможность изменения уровня яркости или контрастности, применения различных художественных эффектов, удаления объектов с фото и так далее.






Источник: arxiv.org



Пока разработка от Apple находится на раннем этапе разработки, код ее опубликован на GitHub. Демоверсия модели MGIE доступна на сайте для исследователей машинного обучения Hugging Face Spaces. Отметим, что в сервисе обрабатываются запросы только на английском языке. На момент выхода скорость работы может быть снижена в связи с большим количеством запросов.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Apple в сотрудничестве с Калифорнийским университетом выпустила новую модель искусственного интеллекта MGIE (MLLM-Guided Image Editing) с открытым исходным кодом. С ее помощью можно редактировать фотографии, задавая для этого текстовые команды. Как пишет Rozetked, для интерпретации пользовательских команд и их выполнения используются мультимодальные большие языковые модели (MLLM). То есть при редактировании одновременно нейросеть может как распознавать объекты на изображении, так и понимать текстовые запросы. Благодаря такому решению изображение можно менять локально и глобально. К примеру, есть возможность изменения уровня яркости или контрастности, применения различных художественных эффектов, удаления объектов с фото и так далее. Источник: arxiv.org Пока разработка от Apple находится на раннем этапе разработки, код ее опубликован на GitHub. Демоверсия модели MGIE доступна на сайте для исследователей машинного обучения Hugging Face Spaces. Отметим, что в сервисе обрабатываются запросы только на английском языке. На момент выхода скорость работы может быть снижена в связи с большим количеством запросов.

запостил(а)
Smith
Вернуться назад
0

Смотрите также

А что там на главной? )))



Комментарии )))