Skip to content

Курс Компьютерное зрение (глубокое обучение в компьютерном зрении) для баколавров 09.03.04 Программная инженерия

Notifications You must be signed in to change notification settings

MVRonkin/Computer-Vision-Course_lec-practice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Материалы курса представлены в репозитории https://github.com/MVRonkin/Computer-Vision-Course_lec-practice/tree/main/2025

Содержание курса Mind Map

Description

Основные материалы курса

код Раздел Содержание ссылка на лекцию ссылка на практику Контрольное мероприятие
1. Введение в предмет компьютерное зрение Задачи компьютерного зрения, понятие и особенности цифровых изображений, понятие признаки в компьютерном зрении, понятие свертка в цифровой обработке изображений.
Обзор алгоритмов предобработки изображений: построение фильтров размытия, резкости и выделения границ, бинаризация изображений, нелинейные фильтры
Построение последовательностей предобработки изображений в OpenCV
Сравнение библиотек работы с изображениями
GitHub 1, GitHub 2 GitHub GitHub 2 -
2. Обзор классических подходов к решению задач компьютерного зрения Классические подходы к решению задач компьютерного зрения: поиск изображений по признакам SIFT, и по эталону, методы обнаружения объектов (Виолы-Джонса), Сегментация Watershed, Понятие Оптический поток
Решение задачи компьютерного зрения классическими методами
GitHub GitHub -
3. Современное состояние сверточных нейронных сетей в задачах компьютерного зрения. Внутренняя структура и особенности обучения сверточной нейронной сети ResNet
Сверточные сети семейства ResNet: ResNeXt, Xception, BIT, DenseNet, ResNet-D, NFNet, Step By Step network
Построение и дообучение сверточных нейронных сетей в PyTorch + torchvision с применением backbone сетей семейства ResNet: training pipeline, transfer learning, функции потерь и метрики обучения, анализ результатов обучения.
Решение задачи компьютерного зрения с использованием дообученных моделей
GitHub GitHub Invite
4. Оптимизация сверточных сетей Другие ахритектуры СНС и Архитектуры для низкопроизводительных устройств: MoblieNet block, SE-блок, NAS: EfficientNet, RepVGG/MobileOne,
Приемы разработки и оптимизации специализированных архитектур для работы с изображениями: разработка решений на основе сложных конфигураций сверточных нейронных сетей в timm, приемы обучения СНС.
Решение задачи компьютерного зрения с использованием кастомизации архитектуры под задачу
GitHub GitHub Invite
5. Архитектуры трансфромеры для построения продуктов с компьютерным зрением Архитектура ViT и ее модификации: SwiGLU, MOE, RMSNorm, DeiT и другие
Другие архитектуры типа трансфромеры: SWIN, MobileViT, архитекутры-миксеры, ConvNeXt
Исследование и имплементация SOTA-моделей в задачах анализа изображений на примере семейства моделей ViT в экосистеме HuggingFace
Построение пайплайна. Комбинирует несколько моделей в комплексные решения
GitHub GitHub -
6. Задачи сегментации изображений Переход от задач классификации к задачам Dense Prediction на примере сегментации изображений.
Архитекутры Энкодер-Декодер на примере U-Net,
Архитектуры головной части на примере DeepLab V3/расширенная свертка и нелинейное рецептивное поле.
Архитектуры трансформеры для сегменатции изображений: SegFormer и другие архитектуры.
Применение алгоритмов и библиотек компьютерного зрения для прикладных задач сегментации изображений: SMP, albumentation,
Решение задачи семантической сегментации с использованием дообученных моделей
GitHub GitHub Invite
7. Задачи обнаружения объектов Многоэтапные архитектуры обнаружения объектов на примере Faster-R-CNN/Mask-R-CNN.
Быстрые одноэтапные архитектуры на примере семейства архитектур YOLO
Архитектуры трансформеры для обнаружения объектов на примере сеймества DETER + RT-DETER
Применение алгоритмов и библиотек компьютерного зрения для прикладных задач обнаружения объектов на изображениях на примере YOLO
Решение задачи семантической обнаружение объектов с использованием дообученных моделей
GitHub GitHub Invite
8. Подходы к построению базисных моделей компьютерного зрения Принципы самообучения (MAE, I-JEPA), Контрастное обучение (DINO), мультимодальное обучение (CLIP)
Базисные архитектуры решения отдельных задач (SAM, Ground DINO)
Обзор принципов построения VLM
Разработка стратегий применения базисных моделей CV (компьютерного зрения): zero-shot learning, linerar/non-linear probe и других,
Решение задач распознавания текста на изображении
GitHub - Invite
9. Особенности построения систем с компьютерным зрением Обзор вопросов подготовки данных
Вопросы интерпретируемости результатов работы моделей Grad-Cam
Вопросы оценки надежности решения задач компьютерного зрения TTA,
специальные методы повышения качества, OOD тестирование
Решение задач обнаружения аномалий/дрейфа данных
- - -
10. Предпосылки соврменного компьютерного зрения: Переход от LeNet к ResNet Повтор понятий сверточный блок, рецептивное поле, регуляризация, нормализация, обучение СНС и других понятий),
Построение кастомных сверточных нейронных сетей в PyTorch + torchvision: training pipeline, аугментация, работа с набором данных..
Решение задачи классификации методами компьютерного зрения
GitHub GitHub 1, GitHub 2 Invite

Итогового задания

https://github.com/MVRonkin/Computer-Vision-Course_lec-practice/blob/main/2025/README.md

Литература

Курс сопровождается учбено-методическимими материалами

доп.литература

еще более доп. лит.

всякие интересные репозитории

инструменты

About

Курс Компьютерное зрение (глубокое обучение в компьютерном зрении) для баколавров 09.03.04 Программная инженерия

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published