Мультимодальный синтез и понимание 3D/4D сцен. Модели мира и семантическая интерпретация. Методы точного контроля и редактирования. Данные и обучение: синтез для анализа. Метрики, качество и доверенный ИИ. Эффективный инференс и Edge AI
Направления:
· Нейронный рендеринг и представления: NeRF, 3D Gaussian Splatting и гибридные структуры для реконструкции и генерации.
· Генеративный дизайн и инженерия: Text-to-3D, Text-to-CAD и Point-to-CAD; генерация облаков точек, мешей и B-Rep поверхностей.
· 4D и видео-синтез: Генерация динамических сцен, скелетная анимация и физически корректное движение объектов.
· Обратный инжиниринг: Использование генеративных моделей для восстановления параметров CAD-моделей по визуальным данным.
· Foundation Models для зрения: Использование гигантских предобученных моделей (как SAM 2/3, DINOv2) для задач сегментации и детекции «из коробки».
· Visual Question Answering (VQA) и Reasoning: Модели, которые не просто называют объекты, а объясняют причинно-следственные связи («Почему эта машина остановилась?»).
· Open-Vocabulary Learning: Распознавание любых объектов по текстовому описанию без необходимости иметь их в обучающей выборке.
· Generative World Models: Предсказание будущих состояний сцены для робототехники и беспилотного транспорта.
· LLM как «дирижеры» систем компьютерного зрения: Использование больших языковых моделей для планирования сложных задач компьютерного зрения и управления визуальными агентами.
· Физически обоснованное зрение и генерация: Учет законов физики при синтезе видео и анализе динамических сцен.
· Управляемая генерация: ControlNet, IP-Adapter и механизмы адаптации (LoRA) для сохранения идентичности объектов.
· Локальное редактирование: Inpainting, Outpainting и манипуляция объектами с сохранением геометрической и контекстуальной связности.
· Консистентность видео: Методы обеспечения временной стабильности и логической последовательности событий в генеративном видео.
· Использование GenAI для решения «голода данных» в классическом компьютерном зрении.
· Синтетические наборы данных: Генерация обучающих данных для САПР, медицины и редких сценариев в компьютерном зрении.
· Фильтрация и курирование: Методы автоматической оценки качества и релевантности синтетических данных.
· Zero-shot и Few-shot обучение: Использование предобученных генеративных моделей для задач классификации и сегментации без дообучения.
· Новые бенчмарки: Метрики за пределами FID/CLIP — оценка структурной целостности 3D-моделей, видео-консистентности и физической точности.
· Детекция ИИ-контента: Выявление дипфейков и сгенерированных артефактов в потоке данных компьютерного зрения.
· Оценка логической связности: Проверка соответствия сгенерированных сцен законам реального мира.
· Оптимизация диффузионных моделей: Дистилляция, квантование и ускорение инференса для мобильных устройств и NPU.
· Архитектуры для систем реального времени: Эффективные backbone-сети, объединяющие задачи детекции и генерации.
Председатели:
Кугаевских Александр Владимирович — к.т.н., доцент, старший научный сотрудник факультета программной инженерии и компьютерной техники Университета ИТМО, Санкт-Петербург (E—mail: avkugaevskikh@itmo.ru)
Бабаян Павел Вартанович — к.т.н., доцент, заведующий кафедрой РГТУ им. В.Ф. Уткина, Рязань (E—mail: pvbradio@yandex.ru)