基于多特征融合的早期帕金森病步态特征识别方法

2024-04-13 06:08李一宽
自动化与信息工程 2024年1期
关键词:特征融合

本文引用格式:李一宽.基于多特征融合的早期帕金森病步态特征识别方法[J].自动化与信息工程,2024,45(1):55-60.

LI Yikuan. Gait feature recognition method for early Parkinson's disease based on multi feature fusion[J]. Automation & Information Engineering, 2024,45(1):55-60.

摘要:帕金森病是一种常见的神经退行性疾病,目前尚无可治愈的手段,只有通过药物治疗来缓解发病周期。因此,针对早期帕金森病的研究具有重要意义。针对早期帕金森病步态数据较少、识别准确率较低的问题,提出一种基于多特征融合的早期帕金森病步态特征识别方法。该方法对比传统的单一特征识别方法,识别准确率更高,可为早期帕金森病临床诊断提供一种辅助手段。

关键词:早期帕金森病;步态数据;特征融合;分类识别

中图分类号:TP391.41           文献标志码:A          文章编号:1674-2605(2024)01-0009-06

DOI:10.3969/j.issn.1674-2605.2024.01.009

Gait Feature Recognition Method for Early Parkinson's Disease          Based on Multi Feature Fusion

LI Yikuan

(School of Mechanical and Vehicle Engineering, Chongqing Jiaotong University,                  Chongqing 400074, China)

Abstract: Parkinson's disease is a common neurodegenerative disease, and there is currently no cure available. Only drug treatment can alleviate the onset cycle. Therefore, research on early Parkinson's disease is of great significance. Aiming at the problem of limited gait data and low recognition accuracy in early Parkinson's disease, a multi feature fusion based gait feature recognition method for early Parkinson's disease is proposed. Compared with traditional single feature recognition methods, this method has higher recognition accuracy and can provide an auxiliary method for early clinical diagnosis of Parkinson's disease.

Keywords: early Parkinson's disease; gait data; feature fusion; classification recognition

0 引言

帕金森病(Parkinson disease, PD)是一種与年龄相关的神经退行性疾病。据统计,目前全球的PD患者有700多万人,我国的PD患者近300万人,约占全球PD患者总数的一半[1]。根据专家预测,2030年我国的PD患者将达到500万人[2]。

目前,临床上针对PD的治疗尚无可治愈的手段。因此,早发现早治疗,延缓病人的发病周期显得尤为重要[3]。PD的诊断主要采用评估量表法(H&Y评估量表、Webster帕金森分级量表、UPDRS评估量表等)和影像学法,这两种方法主观性较强,对医师个人能

力要求较高。根据调查发现,PD的误诊率达10%~ 50%[4]。

为提高PD诊断的高效性和可靠性,许多学者将人工智能技术应用于PD诊断。LITTLE等[5]利用音高周期熵(pitch period entropy, PPE)的声调测量方法,提取10个声调高度不相关的特征向量,并采用核支持向量机进行分类,实验结果表明,该方法能够很好地区分PD患者和健康人群。张小恒等[6]通过对PD语音数据集进行稀疏编码,并对比传统稀疏编码和卷积稀疏编码,证明了卷积稀疏编码能提取更高层的数据特征,可更准确地区分PD患者与健康人群。ZHAO

等[7]通过卷积神经网络和长短期记忆网络分别从语音和log-mel频谱中学习相关特征,实现PD的多级分类。虽然以上方法在PD诊断中取得了一些成果,但仍存在一些棘手的问题,如病人数据涉及个人隐私和医学伦理等问题,可采集的数据较少,导致基于数据驱动的模型识别准确率较低[8]。

为此,本文在有限数据的情况下,提出一种基于多特征融合的早期帕金森病步态特征识别方法,可从不同特征中获得更多、更深层次的信息,提高模型的分类性能。

1 步态数据描述与特征提取

1.1 步态数据描述

本文使用来自Physionet数据库的PD步态数据集。该数据集由3个独立的采样小组,分别在3种不同的测试环境(正常行走Ga,听觉刺激行走Ju,跑步机上行走Si)中对166名受试者进行测试。在受试者的左、右足底各安装8个压力传感器(force sensitive resistors, FSR),以100 Hz的采样频率记录受试者足底垂直地面的反作用力(vertical ground reaction force, VGRF),采集时间约为2 min,FSR安装位置如图1所示。

166名受试者中包含73名健康人和93名PD患者,每名受试者的步态数据对应一个文件。该文件中1~16列为每个FSR记录的VGRF值随时间的变化,17、18列分别为左、右脚VGRF值的和。不同H&Y等级(0级为无症状,等级越高PD程度越严重)下相关受试者的基本物理信息如表1所示。

1.2 步态数据预处理

受外界因素干扰,采集的步态数据可能存在缺失值或异常值。为了使FSR采集的VGRF数据含有节律性,先对步态数据进行预处理。考虑到受试者在测试初期需加速,测试末期需减速,去除FSR采集的前20 s和后10 s的步态数据。以100 Hz频率采集2 min的步态数据,截取后的单个步态数据样本约含有9 000个樣本点。考虑到受试者摆动时,FSR可能会记录一些较小的VGRF值,因此把小于20 N的VGRF值置为0 N。《中国治疗帕金森病指南(第三版)》[9]指出,H&Y等级≤2.5为早期帕金森病患者。PD步态数据集中166个数据样本筛选后,得到健康步态数据73个,早期PD步态数据83个(55+28),中期PD步态数据10个。

1.3 步态特征提取

步态是指人体步行时的姿态和行为特征,可以反映人体的机能,常用于临床研究,即根据步态检测疾病[10]。人体在正常行走的过程中,左、右脚交替轮换摆动,具有周期性和规律性。一个完整的步态运动周期定义为同侧脚两次着地的时间差,一个步态运动周期如图2所示。

一个步态运动周期分为支撑期和摆动期,又称为支撑相和摆动相。其中,支撑相约占整个步态运动周期的60%,摆动相约占整个步态运动周期的40%。

FSR采集的早期PD患者左、右脚VGRF时间序列如图3所示。

图3中:P1为右脚脚后跟开始离开地面进入单腿摆动的时间点;P2为右脚脚尖接触地面进行单腿站立的时间点;P3为结束站立,右脚进入下一个步态运动周期的起始时间点。

根据以上描述,以右脚VGRF值为例,提取相应的特征参数:站立时间、摆动时间和步幅时间等。

站立时间,单脚与地面接触的时间。在一个步态运动周期中,站立时间的起点位于VGRF值从0 N开始递增的位置,终点为VGRF值下降到0 N的位置,起点与终点间隔的样本个数为站立时间。站立时间Sa的计算公式为

(1)

摆动时间,脚与地面没有接触的时间。摆动时间内所有的VGRF值为0 N,即一个步态运动周期内,第一个VGRF值为0 N到最后一个VGRF值为0 N的时间差。摆动时间Sw的计算公式为

(2)

步幅时间,站立时间和摆动时间的和。步幅时间Sr的计算公式为

(3)

本文利用步态特征的变异系数,体现早期PD患者与健康人的步态运动周期区别。步态特征的变异系数计算公式为

(4)

式中:为步态特征参数的平均值,为步态特征参数的标准差。

2 方法

2.1 统计学方法

采用IBM SPSS statistics 26统计学软件对步态特征进行独立样本T检验。t值的计算公式为

(5)

式中:、为2个独立样本的平均值,n1、n2分别为两组样本的总数,S1、S2分别为样本标准差。

对两组独立样本之间差异的显著性进行统计学评估,根据t值利用统计学软件得到的结果为P。当P<0.05时,表明两组特征有显著差异;当P<0.001时,表明两组特征有极其显著的差异;当P>0.05时,无统计学意义[11]。

2.2 特征融合法

特征融合是一种将多个特征或特征集合结合在一起,形成一个更强大,更具有丰富信息的特征表示方法[12],具有提高预测性能、捕捉特征的层次信息、提高模型的泛化能力等特点。考虑到以后的实验可能会提取更多的参数,本文采用特征融合法中的特征拼接法,首先,将提取的特征进行归一化处理;然后,将特征进行向量拼接,组合成特征矩阵;最后,将特征矩阵输入分类模型进行分类识别。特征拼接法可保留原始特征的信息;帮助模型更好地捕捉特征之间的互补关系和交互影响,从而增强模型的表达能力;拼接不受特征类型的限制,具有较强的模型泛化能力。

2.3 支持向量机算法

支持向量机(support vector machine, SVM)算法[13]是一种常用的监督学习方法,主要用于分类和回归分析。SVM算法思想是寻找一个超平面,将不同类别的样本分开,并且尽可能地远离所有样本,其表达公式为

(6)

式中:是超平面的法向量,是超平面的偏置。

本文利用SVM算法实现早期PD与健康人的分类,二分类SVM算法如图4所示。

在一个二分类SVM算法中,当= +1时,则输入被分到第一类;当= -1时,则输入被分到第二类。

3 实验结果与分析

3.1 步态特征分析

本文提取73名健康人和83名早期PD患者的左、右脚站立时间、摆动时间、步幅时间、变异系数等12个特征参数,如表2所示。其中CO表示健康人群,PD表示早期PD患者。

从表2可知,早期PD组与健康对照组的右脚摆动时间、左脚摆动时间、左脚步幅时间和左脚摆动时间变异系数的P值均小于0.05,说明这4个特征参数有显著差异,可用于区分早期PD患者与健康人群。

3.2 分类结果分析

本文将右脚摆动时间、左脚摆动时间、左脚步幅时间、左脚摆动时间变异系数以及这4个特征拼接的融合特征分别制作5种特征集,每种类型特征集中包含健康人群和早期PD患者的特征参数约14 000个,并将每种特征集的80%数据作为训练集,20%数据作为验证集,输入到SVM模型中进行分类,分类结果如图5所示。

由图5可以看出:特征拼接后的融合特征分类识别准确率最高,达到87.75%;其次是左脚摆动时间的分类识别准确率为71.59%,其余3个特征的分类识别准确率较低,表明本文方法在小样本条件下取得了较好的识别效果,相较于传统的单一特征输入方式具有一定的优越性。

为验证融合特征在不同算法中的表现,将单一特征与融合特征的特征集输入到朴素贝叶斯算法和K近邻算法进行分类识别,结果如图6、7所示。

由图6、7可知:SVM算法对各类型特征的分类识别准确率均优于朴素贝叶斯算法和K近邻算法,说明SVM算法在小样本条件下具有较高的识别准确率;融合特征的识别准确率在SVM算法、朴素贝叶斯算法和K近邻算法中均高于单一特征的识别率,证明了本文方法的优势。

4 结论

本文提出一种基于多特征融合的早期帕金森病步态识别方法。首先,提取VGRF时间序列中的步态特征参数;然后,运用统计学方法寻找具有统计学意义的步态特征参数:右脚摆动时间、左脚摆动时间、左脚步幅时间、左脚摆动时间变异系数,用于区分早期PD患者与健康人群;最后,考虑到小样本条件下早期PD识别准确率较低的问题,采用多特征融合的方法将这4个特征融合。实验结果表明,与单一特征相比,本文方法分类识别准确率更高,可为临床医生诊断早期PD提供一种辅助手段。

参考文献

[1] 刘疏影,陈彪.帕金森病流行现状[J].中国现代神经疾病杂志,2016,16(2):98-101.

[2] 韩艳,张晓红,陈彤,等.帕金森病诊治现状调查[J].中华保健医学杂志,2008,10(1):18-20.

[3] 张杨,蒋森,刘娜,等.早期帕金森病步态障碍的临床特点及研究进展[J].医学信息,2022,35(6):34-36;40.

[4] MEARA J, BHOWMICK BK, HOBSON P. Accuracy of diagnosis in patients with presumed parkinson's disease[J]. Age Ageing, 1999,28(2):99-102.

[5] LITTLE M A, MCSHARRY P E, HUNTER E J, et al. Suitability of dysphonia measurements for telemonitoring of parkinson's disease[J]. IEEE Trans Biomed Eng, 2009,56(4): 1015.

[6] 張小恒,李勇明,王品,等.基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究[J].电子与信息学报,2019,41 (7):1641-1649.

[7] ZHAO Jianfeng, MAO Xia, CHEN Lijiang. Speech emotion recognition using deep 1D & 2D CNN LSTM networks[J]. Biomed Signal Process Control, 2019,47:312-323.

[8] 秦静,马雪倩,高福杰,等.基于步态分析的帕金森病辅助诊断方法综述[J].计算机应用,2023,43(6):1687-1695.

[9] 佚名.中国帕金森病治疗指南(第三版)[J].药学与临床研究,2014,22(4):290.

[10] 李哲.基于EEMD的帕金森病患者步态特征量化分级方法研究[D].长春:吉林大学,2020.

[11] 阮桂海.数据统计与分析:SPSS应用教程[M].北京:北京大学出版社,2005.

[12] 高媛媛.基于多特征融合和机器学习的疾病基因检测大数据分类模型[J].微型电脑应用,2023,39(3):25-27;39.

[13] 李福祥,王雪,张驰,等.基于边界点的支持向量机分类算法[J].陕西理工大学学报(自然科学版),2022,38(3):30-38.

作者简介:

李一宽,男,1996年生,硕士研究生,主要研究方向:机器人与人工智能。E-mail: 976018472@qq.com

猜你喜欢
特征融合
多特征融合的粒子滤波红外单目标跟踪
基于稀疏表示与特征融合的人脸识别方法
一种“客观度量”和“深度学习”共同驱动的立体匹配方法
多特征融合的纹理图像分类研究
语谱图傅里叶变换的二字汉语词汇语音识别
基于多特征融合的图像匹配算法
人体行为特征融合与行为识别的分析
基于移动端的树木叶片识别方法的研究
基于SIFT特征的港口内舰船检测方法
融合整体与局部特征的车辆型号识别方法