Распознавание лиц

Продолжая цикл статей на тему аналитических модулей программного обеспечения для систем видеонаблюдения, мы хотим рассказать о технологии распознавания лиц. О распознавании лиц можно говорить вечно, но мы, как всегда, возьмем самое важное и расскажем Вам простыми словами.

Для начала определим круг задач, которые можно решать с помощью данной технологии (это точно не всё, но определенно самое основное):

  • Организация контроля доступа с помощью распознавания лиц
  • Поиск человека в «чистой зоне»
  • Поиск человека в толпе
  • Поиск человека в толпе, которого нет в базе данных
  • Маркетинговые исследования

Есть несколько вариантов организации системы видеонаблюдения с распознаванием лиц. Самым распространенным на сегодняшний день является схема «камера + сервер», но также доступны варианты «камера со встроенной аналитикой» и «камера + облачный сервер». Независимо от того какой из вариантов Вы установите, задачи будут решаться любой из вышеперечисленных систем, но есть большое «НО». Помимо стоимости системы есть такое понятие как «точность распознавания» и это очень важно, потому что любая ошибка (первого или второго рода) может привести к печальным последствиям. Ошибка первого рода FAR (False Acceptance Rate) – это вероятность того, что мы разрешаем доступ злоумышленнику, а ошибка второго рода FRR (False Rejection Rate), соответственно – вероятность того, что мы запрещаем доступ своему. Думаю, заострять внимание на том, почему это проблема нет большого смысла, поэтому продолжаем разбираться.

В большинстве случаев система, реализованная на базе камеры и сервера, имеет большую точность нежели два других варианта. Но тут тоже есть оговорки и все зависит от ПО, которое Вы используете, поэтому не стоит свято верить, что «камера + сервер» — гарант лучшего решения. В данном варианте все достаточно просто – достаточно дорого, но при этом качественно. Самостоятельно подбирать систему и устанавливать не рекомендуется так как есть ряд важных моментов, с которыми Вам помогут разобраться наши специалисты, обратитесь к ним любым удобным для Вас способом!

 Самыми же интересными вариантами реализации с точки зрения теории являются «камера со встроенной аналитикой» и «камера + облачные ресурсы». Оба этих варианта доступней по цене, но имеют меньшую точность, что в некоторых случаях может быть критично.

Так же к минусам камер со встроенной аналитикой можно отнести тот факт, что они не выгодны производителям ПО так как теряется необходимость покупать у них дорогие программные модули, поэтому такие вещи на сегодняшний день редко интегрируются в специализированное программное обеспечение, но рано или поздно это произойдет, а к тому моменту повысится качество распознавания таких решений.

Узким местом облачных систем является необходимость передачи данных третьим лицам и вообще наличие канала передачи этих данных. Не всегда это может быть технически возможно, а учитывая задержки сети и объём передаваемой информации (камера в высоком разрешении, например, да и камер может быть несколько), то становится не очень интересно, разве что дома что-то автоматизировать на базе подобной системы. Но остается открытый вопрос по передаче биометрических данных на удаленный сервер и если физическому лицу не всегда хочется это делать, то какое-нибудь АО не может этого сделать в целях безопасности.

Помимо теоретических основ, необходимых для выбора технологии и ПО (если это предусматривается), необходимо понять какие требования предъявляются к камерам.

Рекомендации по выбору камеры и ее настройки:

  • Не рекомендуется использовать камеры с объективами fish-eye.
  • На камере должно быть настроено минимально возможное значение выдержки. Не допускаются значения более 1/100 секунды. Рекомендуемые значения: от 1/200 и менее. При затемнении картинки или появлении шумов на рекомендуемых значениях выдержки, следует заменить камеру на модель с лучшими характеристиками чувствительности матрицы или увеличить освещенность зоны съемки.
  • В настройках потока камеры должно быть выбрано минимально возможное значение GOP и минимальное сжатие потока. Рекомендуется выбирать постоянный тип битрейта со значениями, соответствующими максимальному качеству изображения.
  • Глубина резкости должна по возможности покрывать всю область предполагаемой детекции. Резкость должна быть настроена на получение максимально качественной картинки в области наилучших условий для распознавания лица.
  • Рекомендуется отключение таких функций, как шумоподавление, и прочих цифровых преобразований изображения.
  • При наличии высококонтрастных участков с разной степенью освещенности в зоне съемки рекомендуется использовать камеры с аппаратным WDR.
  • Визуально картинка должна быть четкая, без искажений. Лица на изображении должны быть достаточно контрастными, освещенными и хорошо различимы невооруженным глазом.
  • На получаемом изображении ширина лица должна быть не менее 64px. Если вписать лицо в квадрат, то сторона должна получиться не менее 128px.
Распознавание лиц

Ориентировочная ширина лица взрослого человека составляет 130 мм. Таким образом плотность пикселей в области съемки должна составлять не менее 64/130 ~ 0,5px/мм = 500px/м

Но 64px это минимально значение ширины лица, которое доступно в настройках модуля. На практике, как правило, устанавливается 128px.

Пример расчета для 128px:

128/130 ~ 0,984px/мм = 984px/м

Ширина области наблюдения, метры 1.0 2.0 3.0 4.0
Необходимый угол обзора для захвата такой ширины с расстояния в 5 метров 11.4 22.6 33.4 43.6
Необходимое кол-во пикселей изображения по горизонтали 984 1968 2952 3936
Рекомендуемое кол-во мегапикселей для камеры с соотношением сторон 16/9 1mp 3mp 5mp 8mp

Hpx ≈ 1968 * L * tg(α/2) Для расчета под другие условия, можно использовать следующую формулу:

Где: α — горизонтальный угол обзора камеры

L — расстояние от камеры до зоны распознавания лиц в метрах

Hpx — необходимое минимальное количество пикселей по горизонтали на изображении камеры

Распознавание лиц

Рекомендации по монтажу, выбору и оснащению мест установки:

Область съемки, в которой производится распознавание лиц, должна быть хорошо освещена. Наличие теней на лице или пересвета значительно снизят вероятность распознавания этого человека.

Для качественной работы модуля камеру следует устанавливать в местах с централизованной и структурированной зоной прохода, например, входная дверь в здание. Широкие холлы с хаотичным движением людей — плохое место установки камеры.

Не стоит пытаться перекрыть широкую зону одной камерой. В этом случае рекомендуется установка нескольких камер.

Направление съемки должно быть таким, чтобы лица людей смотрели непосредственно в объектив камеры. Допускаются отклонения по горизонтали или вертикали, но не более 30 градусов.

Наилучшее качество распознавания достигается при отклонении лиц не более чем на 15 градусов.

Распознавание лиц – один из тех вариантов аналитики, где очень важно соблюдать все рекомендации по выбору оборудования (сервер, камера), по их настройке (как программной, так и касательно физической установки камеры). Если нарушить что-то из этих рекомендаций, то можно свести на нет все усилия и растратить бюджет на нерабочую систему. Поэтому системы с использованием сложных аналитических модулей рекомендуем доверить профессионалам!

Похожие статьи