Site icon IoT Daily

Сбер выложил две собственные ИИ-модели в открытый доступ

Бизнес и разработчики получили открытый доступ к обновлённой модели для создания векторных представлений текста — Giga-Embeddings, а также модели для генерации видео Kandinsky Video Lite. Обе модели распространяются по открытой лицензии, допускающей свободное использование в коммерческих проектах любого масштаба. Об этом рассказал старший вице-президент, руководитель блока «Технологическое развитие» в рамках мероприятия «День ИИ» в Сколково.

Kandinsky Video Lite позволяет создавать короткие видео длительностью до 10 секунд на основе текстового запроса (промпта). Это компактная модель, содержащая всего два миллиарда параметров. При этом по внутренним тестам Kandinsky Video Lite превосходит по общему качеству (которое включает в себя оценки качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз.

Особое внимание при обучении Kandinsky Video Lite было уделено пониманию отечественного культурного кода: для этого был сформирован специальный датасет из более чем миллиона изображений и видео — при этом существенная его часть отбиралась в несколько этапов большой командой профессиональных художников и дизайнеров. За счёт этого наша модель хорошо понимает характерные для нашей страны и её истории объекты. Мы также выкладываем ускоренную версию Kandinsky Video Lite Flash, которая работает примерно в 6 раз быстрее базовой модели.

Модели найдут широкое применение среди исследователей, разработчиков и представителей творческих профессий. Теперь создание качественных видеороликов станет доступным каждому, вне зависимости от уровня технических ресурсов или бюджета проекта.

Exit mobile version