当前位置: 首页 > 工具软件 > Face Cam > 使用案例 >

【ESP32】ESP32-Face人脸识别过程概述

长孙哲
2023-12-01

  1. FRMN

FRMN 是一个轻量级的人脸识别模型,专门应用与嵌入式设备,由 MobileNetV2ArcFace Algorithm 结合成。

1.1 介绍

FRMN模型建立在MobileNetV2上。在训练中,使用ArcFace算法,而不是传统的Softmax函数和交叉熵损失函数。为了降低计算复杂性,在训练中使用了较小尺寸(56x56)的图像。

1.2 人脸识别过程

以下步骤是人脸识别的整个过程:

1.获取输入图像,类型为320x240分辨率。

2.启动人脸识别并获取面部 的landmark关键信息坐标。

3.使用“landmark关键信息坐标,对齐面部信息,并获得面部图像的规格。align_face

4.将对齐的面部图像输入到人脸识别算法,并生成Face IDget_face_idrecogze_face

5.将新生成的 face id 和现有的 face ids进行比较,然后获取两个face id之间的距离(通常为欧几里德距离或余弦距离)

6.通过比较这两个face ID之间的距离和指定阈值,确定这两个 face ID是否来自同一个人。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gyPi9oqp-1669881214820)(…/img/face-recognition-system.png)]

1.3 API 函数介绍

  • FACE_REC_THRESHOLD: 人脸识别阈值,默认配置为“0.7”并以余弦距离测量。

    • -距离大于“Face_REC_THRESHOLD”的任何两个face ID均视为同一个人。
    • -降低此参数可提高识别率;并增加该参数以降低错误识别率。
  • NOSE_EYE_RATIO_THRES_MIN: 鼻子与左眼距离和鼻子与右眼距离的 最小比率的阈值。

    • -任何比率低于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -降低此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • NOSE_EYE_RATIO_THRES_MAX:鼻子与左眼距离和鼻子与右眼距离的 最大比率的阈值。

    • -任何比率高于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -增大此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • FLASH_INFO_FLAG: ID数据标志。每当此标志打开时,ID数据存储在 flash中

  • FLASH_PARTITION_NAME: 存储face ID的 flash 分区的名称,该名称与csv文件分区中使用的名称相同。

1.4 选择识别模型

目前为止有五种可供选择的模型:

  • FRMN
  • MFN56_1X
  • MFN56_2X
  • MFN56_3X
  • MFN56_4X

准确率: MFN56_4X > MFN56_3X > MFN56_2X > MFN56_1X > FRMN

1.4.1 模型比较

ModelFRMNMFN56_1XMFN56_2XMFN56_3XMFN56_4X
Functionfrmn_qmfn56_42mmfn56_72mmfn56_112mmfn56_156m
Size1.2MB1.6MB2.0MB2.4MB3.7MB
Time363ms455ms738ms1150ms1540ms

1.5 注意事项

使用 Face Recognition Lib 时的注意事项:

  • 输入图像的格式必须为 56x56 的RGB 图像。使用其他尺寸的图像可能会降低正确识别率

  • 调用align_face() 函数开始人脸对齐(face alignment),调用函数之后,使用对齐的图像进行人脸识别

  • 若想使用 frmn_q()函数生成 face ids,请首先使用 transform_frmn_input() 函数使输入图像标准化并固定指向。

  • cos_distance()euclidean_distance() 这两个函数分别用于计算两个 face ids 的距离,分别以余弦距离和欧几里德距离表示。

    • Cosine distance:范围: [-1,1] ,两个 face ids 的距离越大,相似度越高
    • Euclidean distance: 范围: [0,4], 两个 face ids 的距离越大,相似度越高
  • 若想在flash中存储 face id,而不是在 ram中,请先配置好 flash 分区的csv文件, partitions.csv文件

  • 存储在 ram 中的数据采取 face_id_list的格式,而存储在 flash 中的数据格式如下:

    • 0-31B信息,检查flash中的内容

    • 32-39B Len,用于指示flash中ID的数量

    • 40-4095B预留

    • 每个id需要2KB,从4096B开始

 类似资料: