OBJECT DETECTION IMPROVEMENT WITH FREEZING LAYERS OF YOLOv11 AND YOLO26

Марина Мамута; Ігор Кравченко; Олександр Мамута

doi:10.20535/1970.71(1).2026.361591

Автор(и)

Марина Мамута Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна https://orcid.org/0000-0002-7674-4984
Ігор Кравченко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна https://orcid.org/0000-0002-9223-057X
Олександр Мамута Інститут фізики,Національна академія наук України, Україна https://orcid.org/0000-0002-6404-5879

DOI:

https://doi.org/10.20535/1970.71(1).2026.361591

Ключові слова:

YOLO, виявлення об’єктів, перенесення навчання, комп’ютерний зір

Анотація

Виявлення об’єктів відіграє ключову роль для систем комп’ютерного зору. Однією з провідних моделей для розв’язання цієї задачі на сьогодні є модель YOLO. Для коректного виявлення специфічних класів об’єктів модель YOLO потребує додаткового навчання. З цією метою застосовується метод перенесення навчання. Перспективним підходом у його межах є заморожування шарів. Однак це питання залишається недостатньо дослідженим, особливо для новітніх архітектур серії YOLO, таких як YOLOv11 та YOLO26, попри суттєві вдосконалення, зокрема заміну блоку C2f на C3k2 та додавання блоку C2PSA після SPPF. У статті розглянуто проблему підвищення ефективності виявлення об’єктів моделями YOLOv11 та YOLO26 шляхом застосування заморожування шарів під час перенесення навчання. Експерименти проводилися з використанням двох наборів даних - середнього та малого розміру, які було автоматично завантажено через платформу Roboflow. Стратегія заморожування передбачала аналіз впливу заморожування ключових шарів основної частини таких як C3k2, C2PSA, SPPF, а також окремих шарів шиї, порівняно з підходом без заморожування. Оцінювання здійснювалося за метриками точності, повноти, mAP@50 та mAP@50–95. Усі експерименти виконано в середовищі Google Colaboratory Pro з використанням графічного процесора NVIDIA A100 (40 ГБ пам’яті). Навчання тривало 50 епох із застосуванням механізму ранньої зупинки у разі відсутності покращення протягом 20 епох, розмір пакета становив 16 зразків, швидкість навчання - 0,01. Для моделі YOLO26 використовувався оптимізатор MuSGD, для YOLOv11 – SGD, а також оптимізатор AdamW для обох моделей. Отримані результати свідчать про відсутність універсальної оптимальної стратегії заморожування шарів; натомість сформульовано емпірично обґрунтовані рекомендації. Зокрема, доцільно заморожувати шари основної частини із зупинкою на блоці C3k2 для обох моделей незалежно від вибору оптимізатора. Для YOLO26 додаткові переваги демонструє заморожування до блоку C2PSA включно. У випадку малого набору даних ефективною є стратегія заморожування до блоку SPPF включно, зокрема для YOLO26 з оптимізатором MuSGD. Заморожування шарів шиї вищого порядку не надає суттєвого покращення ефективності, хоча в окремих випадках може підвищувати значення окремих метрик. Також встановлено, що модель YOLOv11, незважаючи на більшу кількість GFLOPs і параметрів тренування, демонструє менший час навчання та нижчу затримку інференсу одного зображення. Крім того, YOLOv11 забезпечує вищі значення метрик точності, повноти, mAP@50 та mAP@50–95 порівняно з YOLO26 для обох наборів даних.

Біографії авторів

Марина Мамута, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

к.т.н., ст. викладач кафедри КІОНС ФРП КПІ ім. Ігоря Сікорського

Ігор Кравченко, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

ст. викладач кафедри КІОНС ФРП КПІ ім. Ігоря Сікорського

Олександр Мамута, Інститут фізики,Національна академія наук України

к.т.н., старший науковий співробітник

Посилання

Katsushi Ikeuchi. Computer Vision. Springer, 2021, 1406. DOI: 10.1007/978-3-030-63416-2

M. A. Trigka, E. Dritsas, “Comprehensive Survey of Machine Learning Techniques and Models for Object Detection”, Sensors, p. 214, 2025. DOI: 10.3390/s25010214

M. K. Jahan, F. I. Bhuiyan, A. Amin et al, “En-hancing the YOLOv8 model for realtime object detection to ensure online platform safety”, Scien-tific Reports, vol. 15, p. 21167, 2025. DOI: 0.1038/s41598-025-08413-4

M. L. Ali, Z. Zhang, “The YOLO Framework: A Comprehensive Review of Evolution, Applica-tions, and Benchmarks in Object Detection”, Computers, vol. 13(12), p. 336, 2024. DOI: 10.3390/computers13120336

J. Redmon, S. Divvala, S. Girshick, A. Farhadi, “You only look once: Unified, real-time object detection”, Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 779–788, 2016. DOI: 10.1109/CVPR.2016.91

A. Yılmaz, Y. Yurtay, N. Yurtay, “YOLO: Devel-opment of a Real-Time Object Detection Model for the Detection of Secretly Cultivated Plants”, Applied Sciences, vol. 15, p. 2718, 2025. DOI: 0.3390/app15052718

H. V. Nguyen, J. H. Bae, Y. E. Lee, H. S. Lee, K. R. Kwon, “Comparison of Pre-Trained YOLO Models on Steel Surface Defects Detector Based on Trans-fer Learning with GPU-Based Embedded Devices”, Sensors, vol. 22(24), p. 9926. DOI: 10.3390/s22249926

T. Y. Lin, M. Maire, S. Belongie et al, “Microsoft COCO: Common Objects in Context”, Computer Vision – ECCV 2014. 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Pro-ceedings, vol. 8693, pp. 740–755, Springer Cham, 2014. DOI: 10.1007/978-3-319-10602-1_48

G. S. R. Machiraju, K. A. Kumari and S. K. Sharif, “Object Detection and Tracking for Community Surveillance using Transfer Learning”, in 6th International Conference on Inventive Computation Technologies (ICICT), Coimbatore, India, pp. 1035-1042, 2021. DOI: 10.1109/ICICT50816.2021.9358698

E. Pandilova, M. Petrov, V. Spasev, I. Dimitrov-ski, I. Kitanovski, “Transfer Learning with Yolo for Object Detection in Remote Sensing”, ICT Innovations 2024. TechConvergence: AI, Business, and Startup Synergy. ICT Innovations 2024. Communications in Computer and Information Science, vol. 2436, pp. 121–135, 2024, Springer Cham. DOI: 10.1007/978-3-031-86162-8_9

P. Hidayatullah, R. Tubagus, “YOLO26: A Com-prehensive Architecture Overview and Key Improvements. DOI: 10.48550/arXiv.2602.14582.

L. T. Ramos, A. D. Sappa, "A Decade of You Only Look Once (YOLO) for Object Detection: A Review", IEEE Access, vol. 13, pp. 192747-192794, 2025. DOI: 10.1109/ACCESS.2025.3630988

A. D. Dobrzycki, A. M. Bernardos, J. R. Casar, “An Analysis of Layer-Freezing Strategies for Enhanced Transfer Learning in YOLO Architectures”, Mathematics, vol. 13. p. 2539, 2025. DOI: 10.3390/math13152539

A. N. Yuma. Rafi, M. Yusuf, “Improving Vehicle Detection in Challenging Datasets: YOLOv5s and Frozen Layers Analysis”, International Journal of Informatics and Computation, vol. 5, no. 2. pp. 31–45, 2023. DOI: 10.35842/ijicom.v5i2.64

Y. Feng, D. A. Sumiyoshi, “Application of Three Transfer Learning Methods Based on YOLOv8 for Object Recognition in Architectural Drawings”, Proceedings of the ASim Conference 2024: 5th Asia Conference of IBPSA, Osaka, Japan, 8–10 November 2024, vol. 5, pp. 443–450, 2024. DOI: 10.69357/asim2024.1256

R. Khanam, M. Hussain, YOLOv11: An Over-view of the Key Architectural Enhancements. DOI: 10.48550/arXiv.2410.17725. Режим доступу: https://arxiv.org/abs/2410.17725

Ultralytics YOLO26 object detection model with P3/8 - P5/32 outputs. [Online]. Available: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/26/yolo26.yaml

YOLO26 Training Recipe. [Online]. Available: https://docs.ultralytics.com/guides/yolo26-training-recipe/#start-simple

Drone detection dataset. [Online]. Available: https://universe.roboflow.com/testing-pde8o/drone-detection-hp47t/dataset/1

Fixed Combined Data v5. [Online]. Available: https://universe.roboflow.com/mariam-aljaberi/target-detection-shahed/dataset/3