Хабровчане, привет!
Как вы, наверное, знаете Университет Иннополис начинает серию вебинаров с нашими преподавателями. Первый вебинар на тему Artificial Intelligence состоится 11 февраля 2014 года в 18:00 по московскому времени. Проведет его Associate Professor Университета Иннополис Самир Белхауари.
Ссылка для регистрации — attendee.gotowebinar.com/register/6601261461187578113. Спешите зарегистрироваться сегодня, количество мест ограничено!
Частичный перевод статьи на тему методики распознавания лиц, опубликованной С. Белхауари в International Journal of Computer Applications, читайте под катом.
Профессор Белхауари шлет Вам свое приветствие:
Статья опубликована в International Journal of Computer Applications (0975 – 8887), Volume 18– No.8, March 2011.
Методика локализации лиц с использованием метода быстрого сравнения с эталоном на основе алгоритма оптимизированной суммы абсолютных разностей, N. Dawoud, S. Belhaouari, J.Janier
Аннотация
До недавнего времени, метод распознавания с помощью сравнения шаблонов (эталонов) широко использовался для решения проблем локализации лиц на изображениях. Нормированная взаимнокорреляционная функция (НВК) считается методом измерения, традиционно используемым для вычисления схожести между имеющимися шаблонами лиц и прямоугольными блоками входного изображения для локализации положения лица на снимке. Однако, всегда существует ошибка в определении положения лица в связи с тем, что некоторые блоки, на самом деле не являющиеся лицом, кажутся более вероятным положением лица, чем правильные блоки. Это объясняется вариациями в освещении или фоновыми отражениями-помехами. В настоящей работе авторы предлагают технику быстрого сравнения с эталоном на основе алгоритма оптимизированной суммы абсолютных разностей (ОСАР) вместо использования НВК для уменьшения эффектов таких вариационных проблем. Во время экспериментов был проведен ряд тестов измерений схожести для подтверждения высокой точности применения метода ОСАР в сравнении с другими методами. Для оценки точности применения описываемого метода использовались две базы данных лиц – Yale Database и MIT-CBCL. Точность локализации составила 100%.
Введение
Локализация лица является первым шагом в системе автоматического распознавания лица. В задаче по локализации лица уже известно, что лицо существует на входном изображении, а задачей является определение расположения этого лица. Однако, локализация лица из входного изображения является довольно трудной задачей в связи с вариациями масштаба, позы, затемнения, освещения, выражений лица и фоновых отражений. Несмотря на многочисленные методики решения этой проблемы, задача по улучшению локализации остается крайне актуальной. Исследования в области распознавания лиц и некоторые методики представлены в работах [1]. Недавнее исследование о распознавании было сделано Yang et al. [2]. Эта группа авторов подразделяет методы детекции на 4 основных категории: основанные на методах искусственного интеллекта [3], инвариантный метод определения характерных точек [4], сопоставление по эталонам [5], метод внешнего вида [6]. Методы сопоставления по эталонам широкого используются для локации лиц на входных изображениях. При использовании этой методики первоначально лица (в основном, изображения в анфас) предварительно детектируются и сохраняются в базе данных. Позже, вычисляется корреляция между блоками вводимого изображения и сохраненными ранее эталонами. Преимуществами этого метода является его малая чувствительность к шумам, простота в использовании и он не требует длительного времени для локации лица из вводимых изображений [7].
Однако, этого недостаточно для детекции лиц на изображениях с сильными вариациями фона и освещения, так как эти изменения могут менять характерные формы распознаваемых объектов. Наиболее простой метод сопоставления по эталонам заключается в создании усредненного эталона из набора изображений, хранящихся в базе данных. В результате, прямоугольные блоки на входном изображении, обладающие высокой корреляционной схожестью, предлагаются в качестве определения месторасположения лица. Такой метод можно назвать техникой фильтруемого сопоставления с усредненным лицом в качестве фильтра.
Одним из широко используемых способов вычисления корреляции между усредненным эталоном лица и прямоугольными блоками входных изображений является методика измерения схожести, например, нормированная взаимнокорреляционная функция (НВК) [8,9]. Однако, на НВК часто влияют показатели освещенности и фоновые отражения, т.к. на изображениях часто встречаются блоки, не являющиеся частью лица, которые имеют те же параметры, что и матрица-эталон усредненного лица. Эта проблема может быть решена с помощью алгоритма суммы абсолютных разностей (САР) [10], который часто используется для сжатия изображений и отслеживания объектов, но САР все же требует дополнительной оптимизации для вычисления более точного расположения лица на изображении. Более того, САР может дать высокую точность локализации лица на изображении с высокой освещенностью, но помехи фона могут повлиять на показатель точности. Авторы работы предлагают усовершенствованную методику локализации на основании ОСАР для уменьшения эффекта воздействия вышеуказанных вариаций…
[1] R. Chellappa, C. L. Wilson and S. Sirohey, «Human and machine recognition of faces: a survey,» Proceedings of the IEEE, vol. 83, pp. 705-741, 1995.
[2] Ming-Hsuan Yang, D. J. Kriegman and N. Ahuja, «Detecting faces in images: a survey,» Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 24, pp. 34-58, 2002.
[3] Zhao Fei and Qiao Qiang, «Face detection based on rectangular knowledge rule and face structure,» in Information Science and Engineering (ICISE), 2009 1st International Conference on, 2009, pp. 1235-1239.
[4] S. Jeng, H. Y. M. Liao, C. C. Han, M. Y. Chern and Y. T. Liu, «Facial feature detection using geometrical face model: An efficient approach,» Pattern Recognit, vol. 31, pp. 273-282, 3, 1998.
[5] A. K. Jain, Y. Zhong and M. Dubuisson-Jolly, «Deformable template models: A review,» Signal Process, vol. 71, pp. 109-129, 12/15, 1998.
[6] M. -. Yang, N. Ahuja and D. Kriegman, «Face recognition using kernel eigenfaces,» in Image Processing, 2000. Proceedings. 2000 International Conference on, 2000, pp. 37-40 vol.1.
[7] Lingmin Meng and T. Q. Nguyen, «Frontal face localization using linear discriminant,» in Signals, Systems, and Computers, 1999. Conference Record of the Thirty-Third Asilomar Conference on, 1999, pp. 745-749 vol.1.
[8] D. Tsai and C. Lin, «Fast normalized cross correlation for defect detection,» Pattern Recog. Lett., vol. 24, pp. 2625-2631, 11, 2003.
[9] Shou-Der Wei and Shang-Hong Lai, «Fast Template Matching Based on Normalized Cross Correlation With Adaptive Multilevel Winner Update,» Image Processing, IEEE Transactions on, vol. 17, pp. 2227-2235, 2008.
[10] M. J. Atallah, «Faster image template matching in the sum of the absolute value of differences measure,» Image Processing, IEEE Transactions on, vol. 10, pp. 659-663, 2001.
Полная версия статьи на английском — www.ijcaonline.org/volume18/number8/pxc3872912.pdf
Ждем Вас на нашем вебинаре 11 февраля в 18:00 (мск)!
Автор: koal