Блог
Распознавание лиц
Продолжая цикл статей на тему аналитических модулей программного обеспечения для систем видеонаблюдения, мы хотим рассказать о технологии распознавания лиц. О распознавании лиц можно говорить вечно, но мы, как всегда, возьмем самое важное и расскажем Вам простыми словами.
Для начала определим круг задач, которые можно решать с помощью данной технологии (это точно не всё, но определенно самое основное):
- Организация контроля доступа с помощью распознавания лиц
- Поиск человека в «чистой зоне»
- Поиск человека в толпе
- Поиск человека в толпе, которого нет в базе данных
- Маркетинговые исследования
Есть несколько вариантов организации системы видеонаблюдения с распознаванием лиц. Самым распространенным на сегодняшний день является схема «камера + сервер», но также доступны варианты «камера со встроенной аналитикой» и «камера + облачный сервер». Независимо от того какой из вариантов Вы установите, задачи будут решаться любой из вышеперечисленных систем, но есть большое «НО». Помимо стоимости системы есть такое понятие как «точность распознавания» и это очень важно, потому что любая ошибка (первого или второго рода) может привести к печальным последствиям. Ошибка первого рода FAR (False Acceptance Rate) – это вероятность того, что мы разрешаем доступ злоумышленнику, а ошибка второго рода FRR (False Rejection Rate), соответственно – вероятность того, что мы запрещаем доступ своему. Думаю, заострять внимание на том, почему это проблема нет большого смысла, поэтому продолжаем разбираться.
В большинстве случаев система, реализованная на базе камеры и сервера, имеет большую точность нежели два других варианта. Но тут тоже есть оговорки и все зависит от ПО, которое Вы используете, поэтому не стоит свято верить, что «камера + сервер» — гарант лучшего решения. В данном варианте все достаточно просто – достаточно дорого, но при этом качественно. Самостоятельно подбирать систему и устанавливать не рекомендуется так как есть ряд важных моментов, с которыми Вам помогут разобраться наши специалисты, обратитесь к ним любым удобным для Вас способом!
Самыми же интересными вариантами реализации с точки зрения теории являются «камера со встроенной аналитикой» и «камера + облачные ресурсы». Оба этих варианта доступней по цене, но имеют меньшую точность, что в некоторых случаях может быть критично.
Так же к минусам камер со встроенной аналитикой можно отнести тот факт, что они не выгодны производителям ПО так как теряется необходимость покупать у них дорогие программные модули, поэтому такие вещи на сегодняшний день редко интегрируются в специализированное программное обеспечение, но рано или поздно это произойдет, а к тому моменту повысится качество распознавания таких решений.
Узким местом облачных систем является необходимость передачи данных третьим лицам и вообще наличие канала передачи этих данных. Не всегда это может быть технически возможно, а учитывая задержки сети и объём передаваемой информации (камера в высоком разрешении, например, да и камер может быть несколько), то становится не очень интересно, разве что дома что-то автоматизировать на базе подобной системы. Но остается открытый вопрос по передаче биометрических данных на удаленный сервер и если физическому лицу не всегда хочется это делать, то какое-нибудь АО не может этого сделать в целях безопасности.
Помимо теоретических основ, необходимых для выбора технологии и ПО (если это предусматривается), необходимо понять какие требования предъявляются к камерам.
Рекомендации по выбору камеры и ее настройки:
- Не рекомендуется использовать камеры с объективами fish-eye.
- На камере должно быть настроено минимально возможное значение выдержки. Не допускаются значения более 1/100 секунды. Рекомендуемые значения: от 1/200 и менее. При затемнении картинки или появлении шумов на рекомендуемых значениях выдержки, следует заменить камеру на модель с лучшими характеристиками чувствительности матрицы или увеличить освещенность зоны съемки.
- В настройках потока камеры должно быть выбрано минимально возможное значение GOP и минимальное сжатие потока. Рекомендуется выбирать постоянный тип битрейта со значениями, соответствующими максимальному качеству изображения.
- Глубина резкости должна по возможности покрывать всю область предполагаемой детекции. Резкость должна быть настроена на получение максимально качественной картинки в области наилучших условий для распознавания лица.
- Рекомендуется отключение таких функций, как шумоподавление, и прочих цифровых преобразований изображения.
- При наличии высококонтрастных участков с разной степенью освещенности в зоне съемки рекомендуется использовать камеры с аппаратным WDR.
- Визуально картинка должна быть четкая, без искажений. Лица на изображении должны быть достаточно контрастными, освещенными и хорошо различимы невооруженным глазом.
- На получаемом изображении ширина лица должна быть не менее 64px. Если вписать лицо в квадрат, то сторона должна получиться не менее 128px.

Ориентировочная ширина лица взрослого человека составляет 130 мм. Таким образом плотность пикселей в области съемки должна составлять не менее 64/130 ~ 0,5px/мм = 500px/м
Но 64px это минимально значение ширины лица, которое доступно в настройках модуля. На практике, как правило, устанавливается 128px.
Пример расчета для 128px:
128/130 ~ 0,984px/мм = 984px/м
| Ширина области наблюдения, метры | 1.0 | 2.0 | 3.0 | 4.0 |
| Необходимый угол обзора для захвата такой ширины с расстояния в 5 метров | 11.4 | 22.6 | 33.4 | 43.6 |
| Необходимое кол-во пикселей изображения по горизонтали | 984 | 1968 | 2952 | 3936 |
| Рекомендуемое кол-во мегапикселей для камеры с соотношением сторон 16/9 | 1mp | 3mp | 5mp | 8mp |
Hpx ≈ 1968 * L * tg(α/2) Для расчета под другие условия, можно использовать следующую формулу:
Где: α — горизонтальный угол обзора камеры
L — расстояние от камеры до зоны распознавания лиц в метрах
Hpx — необходимое минимальное количество пикселей по горизонтали на изображении камеры

Рекомендации по монтажу, выбору и оснащению мест установки:
Область съемки, в которой производится распознавание лиц, должна быть хорошо освещена. Наличие теней на лице или пересвета значительно снизят вероятность распознавания этого человека.
Для качественной работы модуля камеру следует устанавливать в местах с централизованной и структурированной зоной прохода, например, входная дверь в здание. Широкие холлы с хаотичным движением людей — плохое место установки камеры.
Не стоит пытаться перекрыть широкую зону одной камерой. В этом случае рекомендуется установка нескольких камер.
Направление съемки должно быть таким, чтобы лица людей смотрели непосредственно в объектив камеры. Допускаются отклонения по горизонтали или вертикали, но не более 30 градусов.
Наилучшее качество распознавания достигается при отклонении лиц не более чем на 15 градусов.
Распознавание лиц – один из тех вариантов аналитики, где очень важно соблюдать все рекомендации по выбору оборудования (сервер, камера), по их настройке (как программной, так и касательно физической установки камеры). Если нарушить что-то из этих рекомендаций, то можно свести на нет все усилия и растратить бюджет на нерабочую систему. Поэтому системы с использованием сложных аналитических модулей рекомендуем доверить профессионалам!