ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ ВИЯВЛЕННЯ ОБ’ЄКТІВ МОДЕЛЯМИ YOLOV11 ТА YOLO26 ВНАСЛІДОК ЗАМОРОЖУВАННЯ ШАРІВ
DOI:
https://doi.org/10.20535/1970.71(1).2026.361591Ключові слова:
YOLO, виявлення об’єктів, перенесення навчання, комп’ютерний зірАнотація
Виявлення об’єктів відіграє ключову роль для систем комп’ютерного зору. Однією з провідних моделей для розв’язання цієї задачі на сьогодні є модель YOLO. Для коректного виявлення специфічних класів об’єктів модель YOLO потребує додаткового навчання. З цією метою застосовується метод перенесення навчання. Перспективним підходом у його межах є заморожування шарів. Однак це питання залишається недостатньо дослідженим, особливо для новітніх архітектур серії YOLO, таких як YOLOv11 та YOLO26, попри суттєві вдосконалення, зокрема заміну блоку C2f на C3k2 та додавання блоку C2PSA після SPPF. У статті розглянуто проблему підвищення ефективності виявлення об’єктів моделями YOLOv11 та YOLO26 шляхом застосування заморожування шарів під час перенесення навчання. Експерименти проводилися з використанням двох наборів даних - середнього та малого розміру, які було автоматично завантажено через платформу Roboflow. Стратегія заморожування передбачала аналіз впливу заморожування ключових шарів основної частини таких як C3k2, C2PSA, SPPF, а також окремих шарів шиї, порівняно з підходом без заморожування. Оцінювання здійснювалося за метриками точності, повноти, mAP@50 та mAP@50–95. Усі експерименти виконано в середовищі Google Colaboratory Pro з використанням графічного процесора NVIDIA A100 (40 ГБ пам’яті). Навчання тривало 50 епох із застосуванням механізму ранньої зупинки у разі відсутності покращення протягом 20 епох, розмір пакета становив 16 зразків, швидкість навчання - 0,01. Для моделі YOLO26 використовувався оптимізатор MuSGD, для YOLOv11 – SGD, а також оптимізатор AdamW для обох моделей. Отримані результати свідчать про відсутність універсальної оптимальної стратегії заморожування шарів; натомість сформульовано емпірично обґрунтовані рекомендації. Зокрема, доцільно заморожувати шари основної частини із зупинкою на блоці C3k2 для обох моделей незалежно від вибору оптимізатора. Для YOLO26 додаткові переваги демонструє заморожування до блоку C2PSA включно. У випадку малого набору даних ефективною є стратегія заморожування до блоку SPPF включно, зокрема для YOLO26 з оптимізатором MuSGD. Заморожування шарів шиї вищого порядку не надає суттєвого покращення ефективності, хоча в окремих випадках може підвищувати значення окремих метрик. Також встановлено, що модель YOLOv11, незважаючи на більшу кількість GFLOPs і параметрів тренування, демонструє менший час навчання та нижчу затримку інференсу одного зображення. Крім того, YOLOv11 забезпечує вищі значення метрик точності, повноти, mAP@50 та mAP@50–95 порівняно з YOLO26 для обох наборів даних.
Посилання
Katsushi Ikeuchi. Computer Vision. Springer, 2021, 1406. DOI: 10.1007/978-3-030-63416-2
M. A. Trigka, E. Dritsas, “Comprehensive Survey of Machine Learning Techniques and Models for Object Detection”, Sensors, p. 214, 2025. DOI: 10.3390/s25010214
M. K. Jahan, F. I. Bhuiyan, A. Amin et al, “En-hancing the YOLOv8 model for realtime object detection to ensure online platform safety”, Scien-tific Reports, vol. 15, p. 21167, 2025. DOI: 0.1038/s41598-025-08413-4
M. L. Ali, Z. Zhang, “The YOLO Framework: A Comprehensive Review of Evolution, Applica-tions, and Benchmarks in Object Detection”, Computers, vol. 13(12), p. 336, 2024. DOI: 10.3390/computers13120336
J. Redmon, S. Divvala, S. Girshick, A. Farhadi, “You only look once: Unified, real-time object detection”, Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 779–788, 2016. DOI: 10.1109/CVPR.2016.91
A. Yılmaz, Y. Yurtay, N. Yurtay, “YOLO: Devel-opment of a Real-Time Object Detection Model for the Detection of Secretly Cultivated Plants”, Applied Sciences, vol. 15, p. 2718, 2025. DOI: 0.3390/app15052718
H. V. Nguyen, J. H. Bae, Y. E. Lee, H. S. Lee, K. R. Kwon, “Comparison of Pre-Trained YOLO Models on Steel Surface Defects Detector Based on Trans-fer Learning with GPU-Based Embedded Devices”, Sensors, vol. 22(24), p. 9926. DOI: 10.3390/s22249926
T. Y. Lin, M. Maire, S. Belongie et al, “Microsoft COCO: Common Objects in Context”, Computer Vision – ECCV 2014. 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Pro-ceedings, vol. 8693, pp. 740–755, Springer Cham, 2014. DOI: 10.1007/978-3-319-10602-1_48
G. S. R. Machiraju, K. A. Kumari and S. K. Sharif, “Object Detection and Tracking for Community Surveillance using Transfer Learning”, in 6th International Conference on Inventive Computation Technologies (ICICT), Coimbatore, India, pp. 1035-1042, 2021. DOI: 10.1109/ICICT50816.2021.9358698
E. Pandilova, M. Petrov, V. Spasev, I. Dimitrov-ski, I. Kitanovski, “Transfer Learning with Yolo for Object Detection in Remote Sensing”, ICT Innovations 2024. TechConvergence: AI, Business, and Startup Synergy. ICT Innovations 2024. Communications in Computer and Information Science, vol. 2436, pp. 121–135, 2024, Springer Cham. DOI: 10.1007/978-3-031-86162-8_9
P. Hidayatullah, R. Tubagus, “YOLO26: A Com-prehensive Architecture Overview and Key Improvements. DOI: 10.48550/arXiv.2602.14582.
L. T. Ramos, A. D. Sappa, "A Decade of You Only Look Once (YOLO) for Object Detection: A Review", IEEE Access, vol. 13, pp. 192747-192794, 2025. DOI: 10.1109/ACCESS.2025.3630988
A. D. Dobrzycki, A. M. Bernardos, J. R. Casar, “An Analysis of Layer-Freezing Strategies for Enhanced Transfer Learning in YOLO Architectures”, Mathematics, vol. 13. p. 2539, 2025. DOI: 10.3390/math13152539
A. N. Yuma. Rafi, M. Yusuf, “Improving Vehicle Detection in Challenging Datasets: YOLOv5s and Frozen Layers Analysis”, International Journal of Informatics and Computation, vol. 5, no. 2. pp. 31–45, 2023. DOI: 10.35842/ijicom.v5i2.64
Y. Feng, D. A. Sumiyoshi, “Application of Three Transfer Learning Methods Based on YOLOv8 for Object Recognition in Architectural Drawings”, Proceedings of the ASim Conference 2024: 5th Asia Conference of IBPSA, Osaka, Japan, 8–10 November 2024, vol. 5, pp. 443–450, 2024. DOI: 10.69357/asim2024.1256
R. Khanam, M. Hussain, YOLOv11: An Over-view of the Key Architectural Enhancements. DOI: 10.48550/arXiv.2410.17725. Режим доступу: https://arxiv.org/abs/2410.17725
Ultralytics YOLO26 object detection model with P3/8 - P5/32 outputs. [Online]. Available: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/26/yolo26.yaml
YOLO26 Training Recipe. [Online]. Available: https://docs.ultralytics.com/guides/yolo26-training-recipe/#start-simple
Drone detection dataset. [Online]. Available: https://universe.roboflow.com/testing-pde8o/drone-detection-hp47t/dataset/1
Fixed Combined Data v5. [Online]. Available: https://universe.roboflow.com/mariam-aljaberi/target-detection-shahed/dataset/3
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 М.С. Мамута, І.В. Кравченко, О.Д. Мамута

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Авторське право на публікацію залишається за авторами.
Автори можуть використовувати власні матеріали в інших публікаціях за умови посилання на збірник наукових праць "Вісник Київського політехнічного інституту. Серія ПРИЛАДОБУДУВАННЯ" як на перше місце видання та на Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» як на видавця.
Автори публікують свої статті в збірнику на умовах ліцензії Creative Commons:
- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії CC BY 4.0, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на динаміці цитування опублікованої роботи.
Видавець (КПІ ім. Ігоря Сікорського) має право за будь-якого використання цього видання зазначати своє ім'я або вимагати такого зазначення.
Редакційна колегія залишає за собою право розміщувати опубліковані в збірнику статті в різних інформаційних базах для надання відкритого доступу до матеріалів з метою популяризації наукових досліджень та підвищення цитованості авторів.