T/GDAF 008-2023《人像识别产品测试流程规范》和T/GDAF 009-2023《人像识别系统数据集制作规范》标准解读

2023-02-26 13:06广东省公共安全技术防范协会李萍温峻峰王含
中国安全防范技术与应用 2023年4期
关键词:墨镜活体双胞胎

■ 文/ 广东省公共安全技术防范协会 李萍 温峻峰 王含

关键字:人像 测试 数据集

1 引言

T/GDAF 008—2023《人像识别产品测试流程规范》、T/GDAF 009—2023《人像识别系统数据集制作规范》两项标准基于人像识别技术的最新发展编制而成。两项标准结合行业内的技术标准和最佳实践综合考量,为人像识别产品测试提供标准化的方法和流程,确保所使用的数据集的合法性和有效性,促进人像识别系统数据集的共享和标准化,加速行业的发展进程。因两项标准有强相关性,本文通过对标准条款的一并解读,详细介绍标准涉及的各方面要求,为读者更全面的使用标准提供参考。

2 标准背景

随着人工智能、大数据、云计算等技术的快速发展,人像识别技术在各个领域得到越来越广泛的应用,涉及人脸检测、人脸识别、人体态势分析等多个方面。标准通过对人像识别产品测试的各个环节作出规定,包括测试文档要求、测试流程规范等方面,明确了人像识别产品测试所需要遵循的标准化流程和方法,有利于系统地评估人像识别产品的功能和性能,消除产品隐患,提高产品的可靠性和可用性。此外,人像识别系统的性能和准确度直接受到数据集的影响,通过制定规范,可以确保数据集的质量和一致性,确保系统测试水平。人像识别系统需要能够准确地辨认和分类各种不同类型的人像,规范化的数据集制作可以确保包含了足够多的代表性样本,不同干扰因素,以提高系统的普适性和准确性。

3 解析T/GDAF 008-2023《人像识别产品测试流程规范》

3.1 机构要求解析

首先明确了测试机构在合规资质方面需要满足GB/T 27025 或RB/T 214 的要求,并且具备相关的合规资质,例如实验室认可或资质认定证书,保证测试机构的合规性。设置基本门槛后,再通过日常的质量控制和过程规范,比如设置质量监督员进行监督,召开评审会或进行三级评审等手段进行质量控制,确保资质的维护。最后,对数据保护和隐私保护方面提出要求,包括但不限于签署保密协议和建立数据安全管理制度,确保测试过程中的数据安全和隐私保护。

3.2 人员要求解析

测试人员需要具备人像识别技术等相关专业的背景和知识,熟悉人像识别的基本原理、算法和技术,并具备相关的测试经验和技能。同时,也需要具备数据保护和隐私意识,严格遵守相关法律法规和内部数据安全规定,以确保数据的安全性和保密性。

3.3 文档要求解析

测试文档需要包括测试计划、测试记录和测试报告,并且具有相应的修订历史数据、目录、文档标识以及有关作者和审查者的信息。此外,测试机构还需要明确测试活动所需的资源、规定测试活动进度、进行需求分析、制定执行策略和风险分析。项目测试过程记录和测试报告应满足GB/T 25000.51 相应的标准要求。

3.4 测试流程规范解析

测试人像识别产品的测试流程见图1。

图1 测试流程图

3.4.1 测试方案设计

制定详细的测试方案是确保测试顺利进行的关键步骤。具体规定包括资源、进度、需求分析、执行策略和风险分析等方面。

1)资源:明确测试所需的各种资源,包括人力、时间、设备、测试数据等。确保测试团队具备必要的技能和知识来执行测试任务。

2)进度:制定详细的测试进度计划,包括测试准备阶段、测试执行阶段以及测试报告和总结阶段。确保测试能够在规定的时间内完成,并协调好测试与其他开发活动之间的关系。

3)需求分析:明确测试的具体需求和目标,包括对识别率、响应时间、容量限制等性能指标的要求。同时确保测试方案符合相关的法律法规和标准要求。

4)执行策略:确定测试的具体执行策略,包括功能测试、性能效率测试和安全性测试的具体方法和步骤。还需要规定测试数据的选取方式、测试环境的搭建、测试工具的选择等具体细节。

5)风险分析:对测试过程中可能遇到的各种风险进行分析和评估,如测试数据不真实、测试环境不准确、测试工具不可靠等,制定相应的风险应对措施。

一旦测试方案完成设计,确保邀请委托方、供方(开发方)、有关专家和相关人员对测试方案进行评审。评审的目的是确保测试方案的全面性、合理性和可行性,同时有助于获得对测试方案的认可和支持,确保测试工作的顺利进行。

3.4.2 测试用例设计

测试用例的设计需要考虑规范性、可执行性、可再现性、全面性。依据GB/T 25000.51《系统与软件工程 系统与软件质量要求和评价(SQuaRE)第51 部分:就绪可用软件产品(RUSP)的质量要求和测试细则》相关要求设计测试用例。

3.4.3 测试工作准备

根据测试计划的要求,为人像识别产品准备测试数据资源应满足以下要求:

1)选取图片、视频录像:根据测试要求,需要选取符合相关标准要求的图片和视频录像作为测试数据。这些测试数据应涵盖不同场景、光照条件、角度和人物特征,以确保对人像识别产品的全面测试。

2)视频录像播放速度一致性:在利用视频录像进行测试时,需要确保视频录像的播放速度与录制速度相同。这是为了保证测试过程中的视频分析和识别能够准确反映出实际情况,避免因播放速度不一致而导致的误差。

3)测试平台一致性:若无法采用视频录像方式进行测试,可在同一现场环境搭建测试平台,确保测试环境的一致性。同时,多次测试的视频源应保持一致,以确保测试结果的可重复性和可比较性。

总体来说,测试数据资源的选取应考虑到覆盖不同情况下的测试需求,确保测试的全面性和准确性。同时,测试数据应符合相关标准要求,以保证测试的有效性和可靠性。

3.4.4 测试执行

分别从功能性、性能效率和安全性方面进行测试。

3.4.4.1 功能性测试

功能性测试需要测试人像检测、人像特征提取、人像比对、人像搜索、人像追踪、数据统计查询、系统管理维护等方面。

1)人像检测:导入图像或视频,检测图像或视频中的人像,并对其进行框选和标识;

2)人像特征提取:查看是否能将检测到的人像转换为独特的数字特征;

3)人像比对:将两张或多张人像图片进行比对和匹配;

4)人像搜索:在人像数据库中进行快速搜索,找到目标人物的相关信息;

5)人像追踪:对视频流中的人像进行实时跟踪;

6)数据统计查询:对人像数据库中的数据进行汇总、整理和查询;

7)系统管理维护:对人像识别系统进行管理和维护,包括用户权限、数据备份、故障处理等方面。

3.4.4.2 性能效率测试

需要从识别率、单图测试、视频测试、压力测试和容量测试等五个方面进行考虑。

1)识别率:识别率应按照GA/T 1756 中相关要求进行测试;

2)单图测试:选择具有不同分辨率和复杂度的图像,逐个输入到人像识别系统中,并记录每张图像的人像检出时间。根据测试结果,分析系统在不同图像条件下的检测速度;

3)视频测试:使用包含不同场景和人数的视频录像进行测试。记录人像识别系统对每帧视频进行人像检出的时间,并计算平均检出时间;

4)压力测试:将大规模的图像或视频集合输入到人像识别系统中,观察系统的响应和处理速度;

5)容量测试:检测产品的人像库的容量上限(即最多可容纳的人像数量)。在添加新的人像到库中之前,检查当前人像库中的已有人像数量是否已达到容量上限。如果已达到上限,系统可拒绝添加新的人像或给出相应的提示信息。

3.4.4.3 安全性测试

需要规范数据采集,保护数据隐私和采用必要的措施防止数据泄露。

1)人像数据采集应为合法获得,并做好隐私保密工作,满足GB/T 41819 的相关要求;

2)人像数据保护应规范数据传输和数据存储,除按照GB/T 39335 的相关要求进行测试外,并符合下列要求:

a)系统的日志内每条数据应能记载操作者/发起者;

b)系统的日志内每条数据应能记载接收者。

3.4.5 测试报告输出

测试报告是测试活动的一个重要成果,可以帮助利益相关方了解测试的结果和结论。这意味着在实际操作中,测试报告通常包括测试的目的、方法、结果、结论、建议等内容,以及可能的风险和问题。通过输出测试报告,可以确保测试的透明度和可追溯性,帮助相关人员理解测试的过程和结果。标准要求测试机构生成测试报告,并且提到可以参考附录A。

3.4.6 测试文件归档

该部分指出在测试报告输出后,测试相关人员需要将报告及过程文件等一并归档。这意味着在测试活动完成后,相关文件需要进行整理和存档,以便将来的查阅和追溯。归档的文件可能包括测试计划、测试用例、测试执行记录、问题跟踪报告等与测试活动相关的所有文件,以确保测试过程的完整性和可追溯性。

4 解析T/GDAF 009-2023 《人像识别系统数据集制作规范》

4.1 数据集技术要求解析

标准主要从数据来源、数据规模和数据安全保密性等角度进行数据集技术要求。

人像识别数据应来自于不同场景、不同状态的人像图片。场景数据应具有多样性,包括多种自然环境和人文环境,并考虑不同条件下的天气、光照、场地和人群密度等因素。状态数据包括环境状态(如日照、阴雨、雾霾)和人员状态(如标准证件照片、标准步行照片以及各种干扰因素下的步行照片)。

人像识别系统数据集的数据分布见表1,整体趋近正态分布,2 个干扰因素的数据最多约500 万张,0 个干扰因素和5 个或以上干扰因素的数据相对较少。整体分布符合实际情况,绝对完美数据和很多遮挡数据应该是相对少的。同时数据集应包含不同干扰因素数量下的样品数量和人数,并充分测试系统的准确性。干扰因素包括戴口罩、戴墨镜、戴帽子、打伞、面罩、头套等,不同组合形态下的照片数量和人数有所不同。

序号 干扰因素数量 样品数量 人数 示例1 0 个干扰因素 不低于20 万张 不低于20 人 标准步行照戴墨镜步行照、戴帽子步行照、戴口罩步行照、整容状态步行照等3 2 个干扰因素 不低于500 万张 不低于20 人 打伞步行照、戴墨镜+戴口罩步行照等4 3 个干扰因素 不低于200 万张 不低于20 人 打伞+戴墨镜步行照、打伞+戴口罩步行照等2 1 个干扰因素 不低于300 万张 不低于20 人5 4 个干扰因素 不低于150 万张 不低于20 人打伞+戴墨镜+戴口罩步行照、打伞+戴墨镜+双胞胎步行照等6 5 个及以上干扰因素 不低于120 万张 不低于20 人打伞+戴面罩+双胞胎步行照、打伞+戴墨镜+戴口罩+双胞胎步行照等

数据的来源应可靠,数据应完整准确。同时,必须采取措施防止数据泄露和滥用,确保数据的安全性和保密性。

4.2 数据集管理规范解析

4.2.1 数据采集

标准规范了数据的采集方式、采集环境以及采集数据的安全合法性。

1)人像数据的采集方式包括手机拍照、现场采集和数据合作等方式;

2)采集环境需要符合GA/T 1325 的相关要求;

3)在采集数据时,应注重保护用户隐私,遵守法律法规,并确保数据的合法性和安全性;

4)在采集过程中,需要与被拍摄者签订肖像使用授权许可协议。

4.2.2 数据标注

标准根据天气、一般因素和其他因素的组合,使用星号"☆"来表示不同的难度等级见表2。各种因素包括戴墨镜、戴口罩、戴帽子、特殊状态,以及干扰因素如打伞、面罩和头套等。难度等级通过星号的数量来划分,星号越多代表难度越大。

此外,标准也规定了人像识别数据标注的具体标注信息和编号构成方法,以及标注信息的对应关系。图片表格相结合说明了标注方法。其中,标注信息的编号由11 个字段构成,人物代码编号按照26 个英文字母顺序排列。

天气 一般因素 其他因素 难度等级墨镜 / ☆☆口罩 / ☆☆帽子 / ☆☆帽子+墨镜 / ☆☆☆帽子+口罩 / ☆☆☆口罩+墨镜 / ☆☆☆帽子+口罩+墨镜 / ☆☆☆☆墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆口罩 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆帽子 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆帽子+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆晴天帽子+口罩 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆口罩+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆帽子+口罩+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆面罩 / ☆☆☆头套 / ☆☆☆打伞 / ☆☆☆打伞+墨镜 / ☆☆☆☆打伞+口罩+墨镜 / ☆☆☆☆☆打伞 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆打伞+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆打伞+口罩+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆☆打伞 / ☆☆☆打伞+口罩 / ☆☆☆☆打伞+口罩+帽子 / ☆☆☆☆☆打伞+口罩+帽子+墨镜 / ☆☆☆☆☆☆雨天打伞 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆打伞+口罩 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆打伞+口罩+帽子 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆☆打伞+口罩+帽子+墨镜 双胞胎/多胞胎/整容状态/遗容状态(非活体) ☆☆☆☆☆☆☆

4.2.3 数据存储

标准规定人像识别数据按照难度等级进行分类存储。采取加密数据、限制访问权限、定期备份数据和管理内部人员等措施,确保人像数据的保密性、完整性和可用性。

4.2.4 数据质量

标准中图片数据质量要求包括分辨率、色彩深度和灰度级别。

1)分辨率要求至少为720p,即1280×720 像素;

2)色彩深度要求至少为24 位RGB,即每个像素可以表示16777216 种不同的颜色;

3)灰度级别要求至少为256 级,即8 位灰度深度。

5 结语

本文从机构要求、人员要求、文档要求和流程规范等角度解析了T/GDAF 008—2023《人像识别产品测试流程规范》标准,详细介绍了人像识别产品测试流程,为依据该标准开展产品测试工作提供了指导和帮助。对T/GDAF 009—2023 《人像识别系统数据集制作规范》标准涉及的数据集技术要求、数据集管理的规范要求进行总结。本文突出两项标准的重点内容,强调其对行业发展的重要性,同时提供清晰明了的解读,使读者能够充分理解标准的各项规定。

猜你喜欢
墨镜活体双胞胎
词语双胞胎
同是“双胞胎”为何大不同
双胞胎逛“1元店”
张帆:肝穿刺活体组织学检查
让活体肝移植研究走上世界前沿
活体器官移植,你怎么看?
失焦
雪季墨镜
太阳好大,你的墨镜买好了吗
“汪星人”要打“飞的”——话说活体空运