Kandinsky научили генерировать изображения с текстом на русском - «Новости мира Интернет» » Новости мира Интернет
Gemini стал доступен в «Google картах» по всему миру для пеших и велосипедных прогулок - «Новости сети»
Gemini стал доступен в «Google картах» по всему миру для пеших и велосипедных прогулок - «Новости сети»
Капитализация Microsoft рухнула на $357 млрд после успешного отчёта и заявления гендира о популярности Copilot - «Новости сети»
Капитализация Microsoft рухнула на $357 млрд после успешного отчёта и заявления гендира о популярности Copilot - «Новости сети»
Чтобы не отвлекаться на чтение субтитров: для Stellar Blade вышла профессиональная русская озвучка - «Новости сети»
Чтобы не отвлекаться на чтение субтитров: для Stellar Blade вышла профессиональная русская озвучка - «Новости сети»
«Руки не держат, ноги дрожат»: атмосферный симулятор альпиниста Cairn оставил игроков и критиков в полном восторге - «Новости сети»
«Руки не держат, ноги дрожат»: атмосферный симулятор альпиниста Cairn оставил игроков и критиков в полном восторге - «Новости сети»
Выручка Apple взлетела почти на 16 % — iPhone принесли рекордные $85 млрд, несмотря на дефицит чипов - «Новости сети»
Выручка Apple взлетела почти на 16 % — iPhone принесли рекордные $85 млрд, несмотря на дефицит чипов - «Новости сети»
Стратегию Void War удалили из Steam за нарушение авторских прав — игра похожа на смесь FTL: Faster Than Light и Warhammer 40,000 - «Новости сети»
Стратегию Void War удалили из Steam за нарушение авторских прав — игра похожа на смесь FTL: Faster Than Light и Warhammer 40,000 - «Новости сети»
Слухи: Rockstar отложит релиз GTA VI в рознице, но не из-за проблем с производством - «Новости сети»
Слухи: Rockstar отложит релиз GTA VI в рознице, но не из-за проблем с производством - «Новости сети»
Российская компания отобрала у Intel права на Celeron - «Новости сети»
Российская компания отобрала у Intel права на Celeron - «Новости сети»
Первые обзоры Intel Panther Lake — встроенная графика Arc B390 почти догнала мобильную GeForce RTX 4050 - «Новости сети»
Первые обзоры Intel Panther Lake — встроенная графика Arc B390 почти догнала мобильную GeForce RTX 4050 - «Новости сети»
Первое испытание модернизированной ракеты SpaceX Starship V3 запланировано на середину марта - «Новости сети»
Первое испытание модернизированной ракеты SpaceX Starship V3 запланировано на середину марта - «Новости сети»
Новости мира Интернет » Новости интернета » Kandinsky научили генерировать изображения с текстом на русском - «Новости мира Интернет»

Сбер представил обновленную нейросеть Kandinsky, которая теперь может генерировать изображения с надписями на русском языке.



Текст в создаваемом изображении не просто накладывается поверх, а вписывается в контекст. К примеру, можно сгенерировать картинку, где текст органично сочетается с окружением, материалами или освещением, например, начерчен на спине, выпилен из дерева, отлит из металла и так далее.






Prompt: Шикарный толстый пушистый кот в вязаном свитере на котором написано ИГРИСТОЕ. Источник: блог Сбера (здесь и далее)



Чтобы обучить ИИ, разработчики собрали для обучения датасет из более 10 миллионов изображений с русским текстом, написанным разными способами. Благодаря этому модель научилась распознавать печатные, прописные и другие буквы. Обучение проводилось нативно, без использования дополнительных модулей. Затем было организовано дополнительное обучение на экспертном датасете, проверенном и отобранном дизайнерами и художниками.






Prompt: Милая улыбающаяся сиба-ину на насыщенном желтом фоне в розовой футболке на которой зеркальными пайетками вышито СЛАДКАЯ БУЛОЧКА



Пока создатели продолжают работать над стабильностью нейросети и заявляют о некоторых нюансах в ее работе. Например, она может не с первого раза сгенерировать длинные надписи, текст со смесью кириллицы и латиницы, подробное описание сущности или фона. Короткие запросы без указания фона, масштаба и ракурса получаются быстрее и качественнее, но модель в этом случае фантазирует сама.



Чтобы добиться лучшего результата, рекомендуется указать текстуру, освещение, тип букв (рельефные, объемные и так далее). Для прозрачных фактур рекомендуют указать в запросе «контровой свет», «контражур», тогда буквы станут полупрозрачными.






Prompt: На солнечном свету сверкают яркие прозрачные леденцы в виде букв, которые складываются в слово Витаминка. Свет проходит сквозь леденцовые буквы, как сквозь витражи, и оставляет разноцветные отражения на белой глянцевой поверхности. Высокая детализация



Протестировать модель уже могут все желающие в Telegram-боте Kandinsky, во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max) и в веб-версии.


Сбер представил обновленную нейросеть Kandinsky, которая теперь может генерировать изображения с надписями на русском языке. Текст в создаваемом изображении не просто накладывается поверх, а вписывается в контекст. К примеру, можно сгенерировать картинку, где текст органично сочетается с окружением, материалами или освещением, например, начерчен на спине, выпилен из дерева, отлит из металла и так далее. Prompt: Шикарный толстый пушистый кот в вязаном свитере на котором написано ИГРИСТОЕ. Источник: блог Сбера (здесь и далее) Чтобы обучить ИИ, разработчики собрали для обучения датасет из более 10 миллионов изображений с русским текстом, написанным разными способами. Благодаря этому модель научилась распознавать печатные, прописные и другие буквы. Обучение проводилось нативно, без использования дополнительных модулей. Затем было организовано дополнительное обучение на экспертном датасете, проверенном и отобранном дизайнерами и художниками. Prompt: Милая улыбающаяся сиба-ину на насыщенном желтом фоне в розовой футболке на которой зеркальными пайетками вышито СЛАДКАЯ БУЛОЧКА Пока создатели продолжают работать над стабильностью нейросети и заявляют о некоторых нюансах в ее работе. Например, она может не с первого раза сгенерировать длинные надписи, текст со смесью кириллицы и латиницы, подробное описание сущности или фона. Короткие запросы без указания фона, масштаба и ракурса получаются быстрее и качественнее, но модель в этом случае фантазирует сама. Чтобы добиться лучшего результата, рекомендуется указать текстуру, освещение, тип букв (рельефные, объемные и так далее). Для прозрачных фактур рекомендуют указать в запросе «контровой свет», «контражур», тогда буквы станут полупрозрачными. Prompt: На солнечном свету сверкают яркие прозрачные леденцы в виде букв, которые складываются в слово Витаминка. Свет проходит сквозь леденцовые буквы, как сквозь витражи, и оставляет разноцветные отражения на белой глянцевой поверхности. Высокая детализация Протестировать модель уже могут все желающие в Telegram-боте Kandinsky, во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max) и в веб-версии.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))