Мультимодальный синтез и понимание 3D/4D сцен. Модели мира и семантическая интерпретация. Методы точного контроля и редактирования. Данные и обучение: синтез для анализа. Метрики, качество и доверенный ИИ. Эффективный инференс и Edge AI

Направления:

·       Нейронный рендеринг и представления: NeRF, 3D Gaussian Splatting и гибридные структуры для реконструкции и генерации.

·       Генеративный дизайн и инженерия: Text-to-3D, Text-to-CAD и Point-to-CAD; генерация облаков точек, мешей и B-Rep поверхностей.

·       4D и видео-синтез: Генерация динамических сцен, скелетная анимация и физически корректное движение объектов.

·       Обратный инжиниринг: Использование генеративных моделей для восстановления параметров CAD-моделей по визуальным данным.

·       Foundation Models для зрения: Использование гигантских предобученных моделей (как SAM 2/3, DINOv2) для задач сегментации и детекции «из коробки».

·       Visual Question Answering (VQA) и Reasoning: Модели, которые не просто называют объекты, а объясняют причинно-следственные связи («Почему эта машина остановилась?»).

·       Open-Vocabulary Learning: Распознавание любых объектов по текстовому описанию без необходимости иметь их в обучающей выборке.

·       Generative World Models: Предсказание будущих состояний сцены для робототехники и беспилотного транспорта.

·       LLM как «дирижеры» систем компьютерного зрения: Использование больших языковых моделей для планирования сложных задач компьютерного зрения и управления визуальными агентами.

·       Физически обоснованное зрение и генерация: Учет законов физики при синтезе видео и анализе динамических сцен.

·       Управляемая генерация: ControlNet, IP-Adapter и механизмы адаптации (LoRA) для сохранения идентичности объектов.

·       Локальное редактирование: Inpainting, Outpainting и манипуляция объектами с сохранением геометрической и контекстуальной связности.

·       Консистентность видео: Методы обеспечения временной стабильности и логической последовательности событий в генеративном видео.

·       Использование GenAI для решения «голода данных» в классическом компьютерном зрении.

·       Синтетические наборы данных: Генерация обучающих данных для САПР, медицины и редких сценариев в компьютерном зрении.

·       Фильтрация и курирование: Методы автоматической оценки качества и релевантности синтетических данных.

·       Zero-shot и Few-shot обучение: Использование предобученных генеративных моделей для задач классификации и сегментации без дообучения.

·       Новые бенчмарки: Метрики за пределами FID/CLIP — оценка структурной целостности 3D-моделей, видео-консистентности и физической точности.

·       Детекция ИИ-контента: Выявление дипфейков и сгенерированных артефактов в потоке данных компьютерного зрения.

·       Оценка логической связности: Проверка соответствия сгенерированных сцен законам реального мира.

·       Оптимизация диффузионных моделей: Дистилляция, квантование и ускорение инференса для мобильных устройств и NPU.

·       Архитектуры для систем реального времени: Эффективные backbone-сети, объединяющие задачи детекции и генерации.

 

Председатели:

Кугаевских Александр Владимирович — к.т.н., доцент, старший научный сотрудник факультета программной инженерии и компьютерной техники Университета ИТМО, Санкт-Петербург (Email: avkugaevskikh@itmo.ru)

Бабаян Павел Вартанович — к.т.н., доцент, заведующий кафедрой РГТУ им. В.Ф. Уткина, Рязань (Email: pvbradio@yandex.ru)