Анализ эффективности моделей распознавания в потоковом видео
https://doi.org/10.37493/2307-910X.2024.4.4
Аннотация
В статье анализируются архитектуры VGG, MobileNet и ResNet для системы распознавания лицевых медицинских масок в потоковом видео. Глубокая свёрточная нейронная сеть представлена библиотеками Python: Tensorflow, Keras, а также вейвлетов Хаара на базе моделей трех архитектур и был проведен их сравнительный анализ. В результате исследования было выявлено, что метод VGGNet имеет кратно больший объем параметров и медленный в работе, самым быстрым же является Resnet, его точность составляет 97,1% за 30 эпох, а MobileNet – 98,9% за 100 эпох. Но, по производительности обучения MobileNet было заметно, что его точность улучшается, и можно сделать вывод, что точность, безусловно, улучшится, если запустить обучение для большего количества эпох и фотоизображений, при этом компактный размер позволяет использовать его на устройствах со скромными характеристиками.
Ключевые слова
Об авторах
В. М. ГоряевРоссия
Владимир Михайлович Горяев – кандидат педагогических наук, доцент
г. Элиста
Г. А. Манкаева
Россия
Галина Алексеевна Манкаева – старший преподаватель
г. Элиста
Д. Б. Бембитов
Россия
Джиргал Батрович Бембитов – доцент кафедры теоретической физики
г. Элиста
+79615400560
Е. В. Сумьянова
Россия
Елена Владимировна Сумьянова – доцент кафедры экспериментальной и общей физики
г. Элиста
+79615486561
А. Б. Рустем
Россия
Рустем Александрович Бисенгалиев – доцент кафедры экспериментальной и общей физики
г. Элиста
+79613948910
Список литературы
1. Нисиура Х., Кобаяши Т. и др. Оценка бессимптомного соотношения новых коронавирусных инфекций (COVID-19)//Международный журнал инфекционных заболеваний. 2020. т. 94. c. 154-155.
2. Прокопьев Н. Я. Медицинская маска // Техника. Технологии. Инженерия. 2018. № 2 (8). c. 47- 51.
3. Viola P. and Jones M. J. Robust real-time face detection // International Journal of Computer Vision. 2004. v. 57. No. 2. P.137–154.
4. Shanmugamani R., Wenzhuo Y.. Python Reinforcement Learning: Solve complex real-world problems by mastering reinforcement learning algorithms using OpenAI Gym and Tensorflow. Packt Publishing, 2019. 496 p.
5. Krizhevsky A., Sutskever I., Hinton G. E. Imagenet classification with deep convolutional neural networks //Advances in neural information processing systems. Cambridge, Massachusetts :Published by MIT Press. 2012. p. 1097-1105.
6. Горяев В. М., Маштыков С. С., Бембитов Д. Б., Манджиева А. Н., и др. Анализ аппроксимации Чебышева для фильтров с конечными и бесконечными импульсными характеристиками // Современные наукоемкие технологии. 2021. № 11. С. 22-28.
7. Rashid T. Make Your Own Neural Network. A step-by-step gentle journey through the mathematics of neural networks, and making your own using the Python computer language. Charleston : CreateSpace Independent Publishing Platform. 2016. 222 p.
8. Джулли А., Пал С. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow. M.: ДМК Пресс, 2018. 296 c.
9. Рашка С., Мирджалили В. Python и машинное обучение: машинное и глубокое обучение с использованием Python, scikit-learn и TensorFlow 2, 3-е изд.: Пер. с англ. СПб.: ООО "Диалектика", 2020. 848 с.
10. Tensorflow API Documentation [Электронный ресурс]. 2022. URL: https://www.tensorflow.org/api_docs/python/tf.
11. Ф. Шолле. Глубокое обучение на Python. СПб.:Питер, 2022, 400 с.
12. Weekly J. A., Ployhart R. E. An introduction to situational judgment testing // Situational judgment tests: theory, method and application. New Jersey: LEA, 2006. p. 1–12.
13. Гонсалес, Р. Цифровая обработка изображений. М.:Техносфера,2012. 1104 с.
14. Горяев В.М., Бурлыков В.Д., Прошкин С.Н., Лиджи-Гаряев В.В., Джахнаева Е.Н. ROC-кривая и матрица путаницы как эффективное средство для оптимизации классификаторов машинного обучения // Вестник башкирского университета. 2023.No 1. С. 36–44. DOI: DOI: 10.33184/bulletin-bsu-2023.1.4.
15. Ren S, He K, Girshick R, Sun J, Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks// IEEE Trans Pattern Mach Intell. 2017. No.39(6). p.1137-1149.
16. Yang G. et al. Face Mask Recognition System with YOLOV5 Based on Image Recognition//IEEE 6th International Conference on Computer and Communications (ICCC). 2020. p. 1398-1404.
17. Senthil К., Benisha J., Aathish V.. Face mask and social distance detection in CCTV video streams using ai and computer vision.// International Research Journal of Engineering and Technology (IRJET). 2021. V.08.Is.07. p. 3214-3220.
18. Орельен Ж. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем. Пер. с англ. СпБ.: Альфакнига, 2018. 688 с.
19. Рашид Т. Создаём нейронную сеть. Математические идеи, лежащие в основе нейронных сетей, и поэтапное создание собственной нейронной сети на языке Python. M.: Вильямс, 2018. 272 с.
20. Meier U., Schmidhuber J. Multi-column deep neural networks for image classification // Computer Vision and Pattern Recognition (CVPR). IEEE Conference on. 2012. p. 3642-3649.
21. Howard, A. G. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications / A. G. Howard// CoRR. 2017. arXiv:№ 1704.04861. 9 p.
22. Шумский С.А. Машинный интеллект. Очерки по теории машинного обучения и искусственного интеллекта. М.: РИОР, 2019. 340 с
23. Da-Wen Sun Computer Vision Technology for Food Quality Evaluation / Edited by Da-Wen Sun. Sandiego: Academic Press, 2016. 635 p
24. Желтов С.Ю. и др. Обработка и анализ изображений в задачах машинного зрения. М.: Физматкнига, 2010. 672 с.
25. Новикова, Н.М. Распознавание изображений с помощью свёрточной нейронной сети и нечеткого гибридного классификатора / Н.М. Новикова, В.М. Дуденков // Нейрокомпьютеры: разработка, применение. М.: Радиотехника, 2015. № 2. С. 43-47.
Рецензия
Для цитирования:
Горяев В.М., Манкаева Г.А., Бембитов Д.Б., Сумьянова Е.В., Рустем А.Б. Анализ эффективности моделей распознавания в потоковом видео. Современная наука и инновации. 2024;(4):43-52. https://doi.org/10.37493/2307-910X.2024.4.4
For citation:
Goryaev V.M., Mankaeva G.A., Bembitov D.B., Sumyanova E.V., Bisengaliev R.A. Analysis of the efficiency of recognition models in streaming video. Modern Science and Innovations. 2024;(4):43-52. (In Russ.) https://doi.org/10.37493/2307-910X.2024.4.4