Материалы курса представлены в репозитории https://github.com/MVRonkin/Computer-Vision-Course_lec-practice/tree/main/2025
| код | Раздел | Содержание | ссылка на лекцию | ссылка на практику | Контрольное мероприятие |
|---|---|---|---|---|---|
| 1. | Введение в предмет компьютерное зрение | Задачи компьютерного зрения, понятие и особенности цифровых изображений, понятие признаки в компьютерном зрении, понятие свертка в цифровой обработке изображений. Обзор алгоритмов предобработки изображений: построение фильтров размытия, резкости и выделения границ, бинаризация изображений, нелинейные фильтры Построение последовательностей предобработки изображений в OpenCV Сравнение библиотек работы с изображениями |
GitHub 1, GitHub 2 | GitHub GitHub 2 | - |
| 2. | Обзор классических подходов к решению задач компьютерного зрения | Классические подходы к решению задач компьютерного зрения: поиск изображений по признакам SIFT, и по эталону, методы обнаружения объектов (Виолы-Джонса), Сегментация Watershed, Понятие Оптический поток Решение задачи компьютерного зрения классическими методами |
GitHub | GitHub | - |
| 3. | Современное состояние сверточных нейронных сетей в задачах компьютерного зрения. | Внутренняя структура и особенности обучения сверточной нейронной сети ResNet Сверточные сети семейства ResNet: ResNeXt, Xception, BIT, DenseNet, ResNet-D, NFNet, Step By Step network Построение и дообучение сверточных нейронных сетей в PyTorch + torchvision с применением backbone сетей семейства ResNet: training pipeline, transfer learning, функции потерь и метрики обучения, анализ результатов обучения. Решение задачи компьютерного зрения с использованием дообученных моделей |
GitHub | GitHub | Invite |
| 4. | Оптимизация сверточных сетей | Другие ахритектуры СНС и Архитектуры для низкопроизводительных устройств: MoblieNet block, SE-блок, NAS: EfficientNet, RepVGG/MobileOne, Приемы разработки и оптимизации специализированных архитектур для работы с изображениями: разработка решений на основе сложных конфигураций сверточных нейронных сетей в timm, приемы обучения СНС. Решение задачи компьютерного зрения с использованием кастомизации архитектуры под задачу |
GitHub | GitHub | Invite |
| 5. | Архитектуры трансфромеры для построения продуктов с компьютерным зрением | Архитектура ViT и ее модификации: SwiGLU, MOE, RMSNorm, DeiT и другие Другие архитектуры типа трансфромеры: SWIN, MobileViT, архитекутры-миксеры, ConvNeXt Исследование и имплементация SOTA-моделей в задачах анализа изображений на примере семейства моделей ViT в экосистеме HuggingFace Построение пайплайна. Комбинирует несколько моделей в комплексные решения |
GitHub | GitHub | - |
| 6. | Задачи сегментации изображений | Переход от задач классификации к задачам Dense Prediction на примере сегментации изображений. Архитекутры Энкодер-Декодер на примере U-Net, Архитектуры головной части на примере DeepLab V3/расширенная свертка и нелинейное рецептивное поле. Архитектуры трансформеры для сегменатции изображений: SegFormer и другие архитектуры. Применение алгоритмов и библиотек компьютерного зрения для прикладных задач сегментации изображений: SMP, albumentation, Решение задачи семантической сегментации с использованием дообученных моделей |
GitHub | GitHub | Invite |
| 7. | Задачи обнаружения объектов | Многоэтапные архитектуры обнаружения объектов на примере Faster-R-CNN/Mask-R-CNN. Быстрые одноэтапные архитектуры на примере семейства архитектур YOLO Архитектуры трансформеры для обнаружения объектов на примере сеймества DETER + RT-DETER Применение алгоритмов и библиотек компьютерного зрения для прикладных задач обнаружения объектов на изображениях на примере YOLO Решение задачи семантической обнаружение объектов с использованием дообученных моделей |
GitHub | GitHub | Invite |
| 8. | Подходы к построению базисных моделей компьютерного зрения | Принципы самообучения (MAE, I-JEPA), Контрастное обучение (DINO), мультимодальное обучение (CLIP) Базисные архитектуры решения отдельных задач (SAM, Ground DINO) Обзор принципов построения VLM Разработка стратегий применения базисных моделей CV (компьютерного зрения): zero-shot learning, linerar/non-linear probe и других, Решение задач распознавания текста на изображении |
GitHub | - | Invite |
| 9. | Особенности построения систем с компьютерным зрением | Обзор вопросов подготовки данных Вопросы интерпретируемости результатов работы моделей Grad-Cam Вопросы оценки надежности решения задач компьютерного зрения TTA, специальные методы повышения качества, OOD тестирование Решение задач обнаружения аномалий/дрейфа данных |
- | - | - |
| 10. | Предпосылки соврменного компьютерного зрения: Переход от LeNet к ResNet | Повтор понятий сверточный блок, рецептивное поле, регуляризация, нормализация, обучение СНС и других понятий), Построение кастомных сверточных нейронных сетей в PyTorch + torchvision: training pipeline, аугментация, работа с набором данных.. Решение задачи классификации методами компьютерного зрения |
GitHub | GitHub 1, GitHub 2 | Invite |
https://github.com/MVRonkin/Computer-Vision-Course_lec-practice/blob/main/2025/README.md
- Ронкин М. В. Долганов А.Ю. Глубокое обучение систем компьютерного зрения : учебное пособие : https://elar.urfu.ru/handle/10995/143721
- Ронкин М.В. Он-лайн курс «Компьютерное зрение» (24 лекции и 10 практик) https://courses.openedu.urfu.ru/course-v1:UrFU+COMPVISION+original.
- Глубокое обучение Китов В.
- Учебник по машинному обучению. Разделы по DeepLearning
- Нейронные сети и их применение в научных исследованиях. Курс МГУ разделы про CV + GitHub
- d2l Dive into Deep Learning. 7,8,14 Chapters
- Deep_learning_school МФТИ
- deepschool blog CV
- MIT Foundation of CV
- stanford cs231n 2025 CV
- hyper.ai (paperwithcode)
- F.Chole Deep learning with python and github
- Zero-to-Mastery learn pytorch
- HF compunity CV course
- autonomous-vision course
- курс по дифузионкам
- pytorch-gradcam-book
- VLM 2025 blogpost HF
- roboflow notebooks collection
- yandex blog VLM и тут и от МТС и тут
- Transformers Tutorials
- DLSchool
- [CVRocket]https://github.com/gracikk-ds/cv-rocket)
- CVEpam
- Vit project
- Vae blog
- NVidea DeepLearning Examples
- DL for Vision 2020
- DL for CV book
- prgoram history cv
- deep_learning_tutorial_iciap
- mit cv dl
- understanding dl book
- uav dl course
- full stack dl 2022
- Famous Deep Learning Papers
- Annotated Research Paper Implementations/Deep Learning Paper Implementations
- blog ssl
- blog pytorch internals
