Метод семантической сегментации изображений на основе нейронной сети с использованием фильтров Габора

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Статья посвящена использованию фильтров Габора для повышения эффективности сверточных нейронных сетей (CNN) в задачах анализа изображений, в частности сегментации. Рассматривается применение фильтров Габора как адаптивного компонента на начальных слоях CNN, что позволяет улучшить выделение текстурных и структурных признаков. Для достижения оптимального баланса между числом обучаемых параметров и точностью предложены адаптивные фильтры Габора, которые увеличивают количество каналов на входе без значительного усложнения модели. Проведен сравнительный анализ архитектур с использованием PSPNet для сегментации изображений, модифицированной адаптивными фильтрами Габора. Рассмотрены ограничения на размер фильтров, обеспечивающие устойчивость к вычислительным затратам. Подтверждена актуальность подхода на наборе данных для сегментации изображений, демонстрирующего улучшение точности при минимальном увеличении числа параметров.

Полный текст

Доступ закрыт

Об авторах

Е. А. Мурин

Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова

Email: kryl@cs.msu.ru

лаборатория математических методов обработки изображений

Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52

Д. В. Сорокин

Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова

Email: dsorokin@cs.msu.ru

лаборатория математических методов обработки изображений

Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52

А. С. Крылов

Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова

Автор, ответственный за переписку.
Email: kryl@cs.msu.ru

лаборатория математических методов обработки изображений

Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52

Список литературы

  1. Fogel Itzhak, Sagi Dov. Gabor filters as texture discriminator // Biological cybernetics. 1989. Vol. 61. No. 2. P. 103–113.
  2. Coding facial expressions with Gabor wavelets / Michael Lyons, Shigeru Akamatsu, Miyuki Kamachi, Jiro Gyoba // Proceedings Third IEEE international conference on automatic face and gesture recognition // IEEE. 1998. P. 200–205.
  3. Kwolek Bogdan. Face detection using convolutional neural networks and Gabor filters // Artificial Neural Networks: Biological Inspirations – ICANN 2005: 15th International Conference, Warsaw, Poland, September 11–15, 2005. Proceedings, Part I 15 / Springer. – 2005. P. 551–556.
  4. Calderon Andres, Roa Sergio, Victorino Jorge. Handwritten digit recognition using convolutional neural networks and Gabor filters // Proc. Int. Congr. Comput. Intell. 2003. P. 1–9.
  5. Chang Shuo-Yiin, Morgan Nelson. Robust CNN-based speech recognition with Gabor filter kernels // Fifteenth annual conference of the international speech communication association. 2014. P. 905–909.
  6. Sarwar Syed Shakib, Panda Priyadarshini, Roy Kaushik. Gabor filter assisted energy efficient fast learning convolutional neural net-works // 2017 IEEE/ACM International Symposium on Low Power Electronics and Design (ISLPED) / IEEE. 2017. P. 1–6.
  7. Gabor convolutional networks / Shangzhen Lu-an, Chen Chen, Baochang Zhang et al. // IEEE Transactions on Image Processing. 2018. Vol. 27. No. 9. P. 4357–4366.
  8. Adaptive Gabor convolutional networks / Ye Yuan, Li-Na Wang, Guoqiang Zhong et al. // Pattern Recognition. 2022. Vol. 124. P. 108495.
  9. Learnable Gabor Convolutional Networks / Guoqiang Zhong, Wei Gao, Wencong Jiao et al. // International Conference on Neural Information Processing / Springer. 2019. P. 305–313.
  10. Residual Gabor convolutional network and FV-Mix exponential level data augmentation strategy for finger vein recognition / Yifan Wang, Huimin Lu, Xiwen Qin, Jianwei Guo // Expert Systems with Applications. 2023. Vol. 223. P. 119874.
  11. Learning Gabor texture features for fine-grained recognition / Lanyun Zhu, Tianrun Chen, Jianxiong Yin et al. // Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023. P. 1621–1631.
  12. Osa Priscilla Indira, Zerubia Josiane, Kato Zoltan. AYANet: A Gabor Wavelet-Based and CNN-Based Double Encoder for Building Change Detection in Remote Sensing // Pattern Recognition / Ed. by Apostolos Antonacopoulos, Subhasis Chaudhuri, Rama Chellappa et al. Cham: Springer Nature Switzerland, 2025. P. 131–146.
  13. Gabor D. Theory of communication: Journal of the Institute of Electrical Engineers // London. 1946. Vol. 93. P. 429–457.
  14. Krizhevsky Alex, Sutskever Ilya, Hinton Geof-frey E. Imagenet classification with deep convolutional neural networks // Communications of the ACM. 2017. Vol. 60. No. 6. P. 84–90.
  15. Fast and efficient facial expression recognition using a Gabor convolutional network / Ping Jiang, Bo Wan, Quan Wang, Jiang Wu // IEEE Signal Processing Letters. 2020. Vol. 27. P. 1954–1958.
  16. Мурин Е.А., Сорокин Д.В., Крылов А.С. Методы классификации гистологических изображений на основе сверточных нейронных сетей с фильтром Габора // GRAPHICON 2024. Материалы 34-й Международной конференции по компьютерной графике и машинному зрению. Омск: Омский государственный технический университет, 2024. С. 656–668.
  17. Deep residual learning for image recognition / Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770–778.
  18. Pyramid scene parsing network / Heng-shuang Zhao, Jianping Shi, Xiaojuan Qi et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. P. 2881–2890.
  19. Gradient-based learning applied to document recognition / Yann LeCun, L´eon Bottou, Yoshua Bengio, Patrick Haffner // Proceedings of the IEEE. 1998. Vol. 86. No. 11. P. 2278–2324.
  20. The cityscapes dataset for semantic urban scene understanding / Marius Cordts, Mohamed Omran, Sebastian Ramos et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 3213–3223.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Блок из 16 вещественных частей фильтров Габора, ориентированных под углами с шагом 11.25°.

Скачать (864KB)
3. Рис. 2. Фильтры AlexNet обученной на наборе данных ImageNet.

Скачать (613KB)
4. Рис. 3. Схема сверточного слоя с фильтром Габора.

Скачать (297KB)
5. Рис. 4. Общий вид архитектуры PSPNet.

Скачать (960KB)
6. Рис. 5. Блок ResNet (а) и GResNet (б)

Скачать (585KB)
7. Рис. 6. Архитектура сетей.

Скачать (420KB)
8. Рис. 7. Примеры фильтров Габора, полученных в процессе обучения: FL-G (a), iAGCN (б), AGCN (в).


© Российская академия наук, 2025