Сбер выпустил Kandinsky 5.0 – новое поколение моделей для генерации изображений и видео - «Новости мира Интернет» » Новости мира Интернет
«Mass Effect, которую мы заслужили»: геймплей грандиозного ролевого боевика Exodus от ветеранов BioWare впечатлил игроков - «Новости сети»
«Mass Effect, которую мы заслужили»: геймплей грандиозного ролевого боевика Exodus от ветеранов BioWare впечатлил игроков - «Новости сети»
Google «перестал кормить» сайты — трафик из поиска обрушился, а ИИ даёт меньше 1 % переходов - «Новости сети»
Google «перестал кормить» сайты — трафик из поиска обрушился, а ИИ даёт меньше 1 % переходов - «Новости сети»
Роскомнадзор снова заявил, что Telegram не исполняет российское законодательство - «Новости сети»
Роскомнадзор снова заявил, что Telegram не исполняет российское законодательство - «Новости сети»
SpaceX впервые провела огневые испытания новейшей версии ускорителя Super Heavy — такой долетит даже до Луны - «Новости сети»
SpaceX впервые провела огневые испытания новейшей версии ускорителя Super Heavy — такой долетит даже до Луны - «Новости сети»
Авторы «невзламываемого» шифрования на основе квантовой физики получили премию Тьюринга - «Новости сети»
Авторы «невзламываемого» шифрования на основе квантовой физики получили премию Тьюринга - «Новости сети»
Pixelpaw Labs представила Phase – мышь, которая превращается в геймпад - «Новости мира Интернет»
Pixelpaw Labs представила Phase – мышь, которая превращается в геймпад - «Новости мира Интернет»
12 лет неприступности: инженерный гений против безопасности Xbox One – представлен первый аппаратный взлом - «Новости мира Интернет»
12 лет неприступности: инженерный гений против безопасности Xbox One – представлен первый аппаратный взлом - «Новости мира Интернет»
Adobe добавила в Photoshop функцию для преобразования двухмерных объектов в 3D-модели - «Новости мира Интернет»
Adobe добавила в Photoshop функцию для преобразования двухмерных объектов в 3D-модели - «Новости мира Интернет»
Apple представила второе поколение полноразмерных наушников AirPods Max 2 - «Новости мира Интернет»
Apple представила второе поколение полноразмерных наушников AirPods Max 2 - «Новости мира Интернет»
Новая консоль Xbox Project Helix объединит игры для ПК и приставки - «Новости мира Интернет»
Новая консоль Xbox Project Helix объединит игры для ПК и приставки - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » Сбер выпустил Kandinsky 5.0 – новое поколение моделей для генерации изображений и видео - «Новости мира Интернет»

На конференции AI Journey Сбер представил обновленную линейку AI-моделей Kandinsky 5.0 – она уже доступна в GigaChat. Модели Image Lite и Video Pro созданы для работы с базовыми задачами и профессиональным визуальным контентом.



Image Lite отвечает за генерацию HD-изображений: иллюстраций, концептов, стилизованных картинок по сложным запросам. Video Pro создает ролики длиной 5 секунд по промпту или начальному кадру: она может анимировать логотип, сделать визуальную зарисовку. Модели уверенно понимают запросы на русском, английском и корректно создают надписи на обоих языках – последнее для генераторов визуального контента до сих пор остается сложной задачей, и поэтому высоко ценится пользователями.



Kandinsky 5.0 обучали на масштабном массиве данных – в него вошли почти миллиард изображений и 300 миллионов видеороликов. Финальные этапы проходили на elitе-датасете, куда вошли тщательно отобранные художниками материалы с идеальной композицией и стилем. Благодаря этому новая версия делает акцент и на технической точности, и на художественной выразительности результата.



Модели интегрированы во все платформы GigaChat: веб-версию, приложение на Android, мессенджеры Telegram и Max. Еще Сбер открыл доступ к Kandinsky 5.0 на GitHub, Hugging Face, GitVerse и позволил разработчикам бесплатно использовать код и веса по лицензии MIT.



Одновременно компания предоставила доступ к стеку GigaChat и выложила модели K-VAE 1.0 для транскрибации речи и компактного представления изображений и видео.



Изображение на обложке: Сбер


На конференции AI Journey Сбер представил обновленную линейку AI-моделей Kandinsky 5.0 – она уже доступна в GigaChat. Модели Image Lite и Video Pro созданы для работы с базовыми задачами и профессиональным визуальным контентом. Image Lite отвечает за генерацию HD-изображений: иллюстраций, концептов, стилизованных картинок по сложным запросам. Video Pro создает ролики длиной 5 секунд по промпту или начальному кадру: она может анимировать логотип, сделать визуальную зарисовку. Модели уверенно понимают запросы на русском, английском и корректно создают надписи на обоих языках – последнее для генераторов визуального контента до сих пор остается сложной задачей, и поэтому высоко ценится пользователями. Kandinsky 5.0 обучали на масштабном массиве данных – в него вошли почти миллиард изображений и 300 миллионов видеороликов. Финальные этапы проходили на elitе-датасете, куда вошли тщательно отобранные художниками материалы с идеальной композицией и стилем. Благодаря этому новая версия делает акцент и на технической точности, и на художественной выразительности результата. Модели интегрированы во все платформы GigaChat: веб-версию, приложение на Android, мессенджеры Telegram и Max. Еще Сбер открыл доступ к Kandinsky 5.0 на GitHub, Hugging Face, GitVerse и позволил разработчикам бесплатно использовать код и веса по лицензии MIT. Одновременно компания предоставила доступ к стеку GigaChat и выложила модели K-VAE 1.0 для транскрибации речи и компактного представления изображений и видео. Изображение на обложке: Сбер

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))