基于模式识别的高水平运动员RS-fMRI数据分类研究

2024-04-01 05:12张可盈张栋丁宇曹春梅
科学技术与工程 2024年8期
关键词:模式识别小脑脑区

张可盈, 张栋, 丁宇, 曹春梅

(1.东南大学体育系, 南京 210018; 2.清华大学体育部, 北京 100084;3.首都体育学院体育人工智能研究院, 北京 100191; 4.北京语言大学心理学院, 北京 100083)

体育科研工作者一直在积极地探索运动员脑的奥秘,希望了解复杂动作的中枢控制机制、以进一步提高动作表现[1-4]。功能磁共振成像(functional magnetic resonance imaging,fMRI)技术的日益成熟为研究者提供了便捷、无创地观察受试者全脑的途径。近年来,越来越多研究表明运动技能学习能诱发脑的可塑性改变,包括脑的结构和功能的改变。一些研究使用专家-新手范式比较高水平运动员和非运动员对照组受试者的脑结构及功能活动差异也取得了重要的研究成果。目前中外学者已经普遍认为运动员在脑可塑性上与普通人存在差异,且不同类型的运动员脑可塑性特征不同[2]。现有的相关研究提示,长期的运动训练使得不同项目运动员脑可塑性呈现差异化表现。而对这些差异进行精准识别,在理论层面能够有助于深化对脑-运动关系的理解、推动脑功能与运动技能融合的交叉学科研究,在实践层面,有助于指导个性化训练和干预、提升运动表现、预防运动损伤,以及促进康复和职业生涯规划。

近年来,随着研究的深入,模式识别技术得到了长足发展[5]。模式识别(pattern recognition)指的是通过使用计算机算法,自动发现数据中的规律性,并利用这些规律性采取行动,从而将数据分类为不同的类别[6-7]。在神经影像学领域中,模式识别又被称为多体素模式分析(multivoxel pattern analysis,MVPA)。MVPA使用分类的机器学习算法分析大量体素上BOLD信号的特征,从而解码其背后的信息,将不同实验条件或不同特征的脑成像数据进行分类[8-9]。在众多的MVPA方法中,支持向量机(support vector machine,SVM)在处理高维数据方面呈现出显著优势[10-12],得到广泛应用。目前,基于SVM的脑影像学数据分类已经广泛应用于精神疾病的诊断和预测上,如抑郁症[13]、孤独症[14]、阿尔兹海默症[15]等,给临床辅助诊断提供帮助。此外,SVM还应用于脑电分类[16]。总体而言,基于SVM的脑影像学数据分类方法展现出了巨大的应用潜力。

虽然基于fMRI技术对运动员脑的研究众多,但目前研究策略还较为单一[17-19]。体育科学研究者多数遵循一般线性模型(general linear model, GLM)这一传统方法处理fMRI 的血氧水平依赖(blood oxygen level dependent, BOLD)信号[20]。在早期,GLM是处理BOLD数据的金标准,但其具有一定的局限性。其中最主要且最严重的局限性是使用GLM的前提假设是相邻体素之间的协方差没有意义[10],即将所有体素分开考虑,然而前提假设具有一定缺陷:一方面,为了提高信噪比,fMRI往往鼓励研究者在预处理时进行空间平滑的操作,这一操作在相当程度上削弱了单个体素的信息可用性[9, 21];另一方面,一部分学者始终认为人脑是模块化的,相邻脑区共同协作完成特定任务。假如将相邻体素之间的协方差看做噪音,那么研究结果的可信度必将受到一定影响。因此,传统方法得出的结论需要更多的证据佐证。作为多变量的分析方法,MVPA对脑活动的空间信息更敏感[22],比传统GLM更容易发现不同特征的脑功能特征差异。

基于此,采用SVM进行fMRI数据集分析,对高水平射击运动、滑冰运动员及非运动员对照组的fMRI信号数据进行训练和分类。运动训练被认为是一种对大脑产生影响的重要干预方式,通过模式识别技术对高水平运动员脑成像数据进行分类,可以更全面地研究运动训练对脑可塑性的影响,进一步丰富运动脑可塑性研究的内容,这将为运动科学领域提供新的理论基础,有助于揭示运动训练对大脑结构和功能的影响,探究运动技能与脑功能的互动机制。

1 研究对象与方法

1.1 研究对象

以15名射击运动员、15名速滑运动员以及15名非运动员健康大学生对照组[9男6女,平均年龄(21.8±2.5)岁,未接受过系统的运动训练]作为研究对象。所有研究对象均为右利手,均无磁共振扫描禁忌症,无重大运动损伤史或神经系统疾病史。在实验开始之前,研究对象被告知磁共振扫描流程,并签署知情同意书。受试者基本信息如表1所示。

表1 受试者基本信息Table 1 Basic information of participants

1.2 研究方法

研究方法如图1所示,首先采集脑成像数据,预处理之后的数据用来计算不同的脑成像指标。包括低频振幅(fractional amplitude of low-frequency fluctuations,fALFF)、局部一致性(regional homogeneity,ReHo)和度中心度(degree centrality, DC)。之后,分别使用3个静息态指标,以及综合使用3个指标的多模态作为分类特征进行模式识别分析。

功能性磁共振成像 (functional magnetic resonance imaging, fMRI)

1.2.1 脑成像数据采集

使用3.0T飞利浦Achieva磁共振扫描仪配合16通道头部线圈收集受试者脑成像数据。T1加权结构像序列(T1-weighted images)扫描主要参数如下:层数180, 翻转角8°,采集矩阵230 mm×230 mm。单层平面回波成像(echo planar imaging, EPI)序列扫描主要参数如下:层数37,TR:2 s,TE:30 ms,翻转角90°,采集矩阵230 mm × 230 mm。在整个扫描过程中,叮嘱研究对象“放松,闭着眼睛并保持清醒。”

1.2.2 脑成像数据处理

使用加载在MATLAB平台上的 RESTplus 1.24软件包(http://restfmri.net/forum/restplus)对fMRI脑成像数据进行处理。预处理步骤如下:①删除前5个时间点的数据;②时间校正;③空间校正(标准:删除平动大于3 mm或者旋转大于3°的数据);④分割脑组织,将其归一化到自身T1结构图上,之后进一步将其归一化到蒙特利尔神经研究所(Montreal Neurological Institute,MNI)模板上;⑤使用8 mm× 8 mm× 8 mm的半峰宽高斯平滑核(full width at half maximum,FWHM)对图像进行平滑处理。预处理之后的数据用来计算不同的脑成像指标。预处理后的数据计算fALFF、ReHo和DC。

1.2.3 模式识别算法

在神经影像学数据中,模式指脑的每个体素的扫描数值或者每个体素通过计算得到的值,分类标签一般指受试者的不同类型[23]。模式对应每个体素的fALFF、ReHo和DC,而标签对应受试者的分组:射击运动员、速滑运动员以及非运动员对照组。

使用SVM核分类算法进行训练,具体操作主要通过使用加载在MATLAB平台上的模式识别神经成像软件包PRoNTo (pattern recognition for neuroimaging toolbox,http://www.mlnl.cs.ucl.ac.uk/pronto/prtsoftware.html)进行[23]。PRoNTo是一个基于模式识别技术的开源MATLAB软件包,用于分析神经影像数据。操作步骤包括:①分别输入射击运动组、速滑运动组、对照组3个指标(fALFF、ReHo和DC),选择年龄和性别作为协变量纳入计算;②特征准备:选择fALFF、ReHo和DC作为学习特征;③模型设置:分别对射击运动组和速滑运动组(分类一,记为CL1)、射击运动组和对照组(分类二,记为CL2)以及速滑运动组和对照组(分类三,记为CL3)之间进行SVM二分类分析,并使用留一交叉验证法(leave-one-out cross validation)计算分类正确率;④计算权重:使用AAL模板,计算每一个脑区在分类算法当中的权重。

由于三组人数相同,平衡后的准确率(balanced accuracy, bACC)和总的准确率(total accuracy, tACC)在树枝上保持相同。使用tACC、接受者操作特性曲线(receiver operating characteristic curve,ROC)、曲线下面积(area under curve,AUC)以及预测准确率来衡量机器分类算法的优劣。tACC越高,模式识别分类器效果越好。此外,使用ROC曲线和AUC来进一步评价分类算法。AUC在0~1,其数值越大,模式识别分类器效果越好。PRoNTo还将计算出为分类算法贡献最高的10个脑区。

2 研究结果

选用适合fMRI数据的SVM算法,对射击和速滑两种项目运动员以及非运动员对照组的脑成像数据进行分类训练,使用留一交叉验证法得到了实验结果。

2.1 分类准确率、ROC曲线及曲线下面积

表2和图2~图5展示了SVM分类算法准确率以及分类效果。tACC除了CL3-DC之外均在70%以上,最高可达到100.00(CL1-DC)。AUC最低为0.65(CL3-DC),最高为1(CL1- fALFF、CL1-DC、CL1-ReHo、CL1-Multimodality)。

表2 分类算法准确率、ROC曲线及曲线下面积Table 2 Accuracy rate, ROC curve and area under the curve of the classification algorithm

虚线代表算法中能将两组数据区分开的线,两组数据在线两侧分布越集中,分类效果越差,反之分类效果越好

虚线代表算法中能将两组数据区分开的线,两组数据在线两侧分布越集中,分类效果越差,反之分类效果越好

虚线代表算法中能将两组数据区分开的线,两组数据在线两侧分布越集中,分类效果越差,反之分类效果越好

虚线代表算法中能将两组数据区分开的线,两组数据在线两侧分布越集中,分类效果越差,反之分类效果越好

在进行射击运动员和滑冰运动员等不同项目运动员之间的分类时(CL1),SVM分类算法表现优秀。无论是单独使用3个指标,还是综合多个指标进行分类,tACC均在96.67%以上,AUC均为1。该结果说明使用SVM算法对不同项目运动员之间的脑静息态功能特征进行分类时,分类正确率较高且分类效果更稳定。

在进行运动员和非运动员对照组的分类时,tACC在50%~93.33%,AUC在0.65~0.99。其中,DC的分类效果最不稳定,而使用fALFF或者综合使用3个静息态指标的分类效果最稳定(tACC均在80%以上,AUC均在0.88以上)。

综合tACC、ROC曲线及曲线下面积以及分类效果不难发现,SVM分类算法经过训练,能够有效地将高水平速滑运动员和射击运动员静息态脑自发活动进行分类。

2.2 不同脑区在SVM分类算法中的贡献

在对射击运动组和滑冰运动组进行分类时(CL1),双侧小脑上部(Cerebelum_3、Cerebelum_4_5)、双侧小脑下部(Crus2、Cerebelum_7b、Cerebelum_8、Cerebelum_9、Cerebelum_10)、小脑蚓(Vermis_1_2、Vermis_3、Vermis_4_5)等脑区在分类器中占到了较高的权重。此外,右侧后扣带回、右侧舌回以及双侧中央旁小叶也在分类器中有一定的作用。

在对射击运动组和对照组进行分类时(CL2),双侧小脑下部(Crus2、Cerebelum_7b、Cerebelum_8、Cerebelum_9、Cerebelum_10)、小脑蚓(Vermis_7、Vermis_8、Vermis_9、Vermis_10)、右侧后扣带回、左侧颞极、右侧眶部额中回、右侧丘脑、右侧舌回、右侧枕上回等脑区在分类器中占到了较高的权重。

在对速滑运动组和对照组进行分类时(CL2),小脑上部(Cerebelum_3、Cerebelum_4_5)、双侧小脑下部(Crus2、Cerebelum_7b、Cerebelum_9、Cerebelum_10)、小脑蚓(Vermis_1_2、Vermis_3、Vermis_4_5)、左侧岛盖部额下回、右侧豆状核、左侧角回、右侧眶部额中回、右侧前扣带回和旁扣带回、右侧三角部额下回、右侧杏仁核、左侧枕下回、双侧嗅皮质等脑区在分类器中占到了较高的权重。

由此可以看出,在用SVM对射击运动组和滑冰运动组进行分类时,主要是小脑的各个位置构成了分类算法的主体部分。而对运动员和对照组进行分类时,除了小脑,还有一些与运动执行和控制及其他功能活动相关的脑区参与了算法的构成。提示不同运动项目运动员的脑功能活动之间差异最明显的部位在小脑上。

3 讨论

3.1 SVM模式识别算法的优势探讨

fMRI成像数据以全脑数万个体积元素(volume pixel)上的BOLD信号以矩阵的形式呈现。正如上文提到的,模式识别是机器学习领域中的一个重要方向,模式识别在研究fMRI信号上具有独特优势,能够弥补由一般线性模型带来的计算不足。在众多分类器中,SVM主要用于解决小样本、高维、非线性问题,因此在处理与fMRI数据类似的小样本多特征的数据时具有更好地表现[9]。SVM算法对患者和对照组脑影像学数据进行二分类,能够辅助精神疾病的诊断和预测已得到广泛应用。研究首次验证了SVM二分类算法在运动科学的应用。分类算法获得了良好的训练结果,tACC除了CL3-DC之外均在70%以上,最高可达到100.00(CL1-DC)。AUC最低为0.65,最高为1。该结果证实了SVM模式识别算法的在对运动员fMRI数据进行分类时依然具有较强的优势。

SVM模式识别算法优势,尤其体现在如射击运动员和滑冰运动员等不同项目运动员之间的分类时(CL1)。无论是单独使用3个指标,还是综合多个指标进行多模态联合分类,tACC均在96.67%以上,AUC均为1。结果表明:使用SVM算法对不同项目运动员之间的脑静息态功能特征进行分类时,分类正确率较高且分类效果更稳定。说明相对于专家-新手比较,不同技能的专家脑功能成像的差异可能更为明显。以往的研究者多只使用专家-新手范式,忽视了不同技能间的横向比较。这一点对研究与动作控制、动作执行、动作监督等过程相关的脑活动有一定的启发。

3.2 不同静息态指标的模式识别效果

在进行运动员和非运动员对照组的分类时,DC的分类效果最不稳定,而fALFF以及联合3个静息态指标的多模态分类效果最稳定(tACC均在80%以上,AUC均在0.88以上)。文献[24]单一特征数据的分类效果可能取决于不同的指标。fALFF、ReHo和DC均为常用的静息态fMRI指标,但其计算方法以及背后的逻辑不同,因此反映的特点也不同。fALFF[25]指的是低频段(0.01~0.08 Hz)的功率谱的ALFF值除以整个频段振幅均值得到的,主要反应脑的静息态自发活动强度,被认为是测量局部大脑活动的有效方法。ReHo反映单个体素和它邻近体素时间序列的相似性[26],本次研究中,计算的是单个体素及与其相邻的27个体素之间的序列相似性。DC则描述将全脑作为复杂网络时,单个体素作为节点的中心性[27]。DC越高,该节点在网络中越重要。ReHo和DC均属于功能连接,但ReHo更着重于小范围(相邻)的功能连接,DC更着重于全脑范围内的功能连接。因此,研究结果可能提示SVM算法在区分静~息态自发活动强度时有更大的优势,而对功能连接指标的处理不够到位。同时,这一结果也提示,将来用fALFF或者;个静息态指标联合分类效果更好。

上述研究结果拓展了目前关于运动与脑功能之间关系的认识,将为运动科学领域提供新的理论基础,帮助揭示运动训练对大脑结构和功能的影响,探究运动技能与脑功能的互动机制。此外,将来的研究可以尝试从从高水平运动员的脑成像数据中提取个体化的特征,实现数据驱动的个体分类。这将为个体化运动训练和康复提供新的理论支持,帮助优化训练和康复计划,提高训练和康复效果。

3.3 SVM分类算法在分类运动员fMRI数据中的应用

目前,SVM分类算法广泛应用于临床多个精神疾病的诊断和预测上,且获得了较好的效果。然而其在运动科学领域的应用研究十分有限,少数学者尝试使用模式识别分类器识别脑震荡[28]、运动想象[29]、最佳运动状态[30],均取得了较好的效果。可以预计,模式识别在运动脑科学领域具有较好的应用前景,但需要进行更多深入研究来推动这一技术的应用。

为了更好地展示分类器的构成,列举分类算法中贡献最高的10个脑区(表3)。可以看出,在用SVM对射击运动组和滑冰运动组进行分类时,主要是小脑的各个位置构成了分类算法的主体部分。而对运动员和对照组进行分类时,除了小脑,还有一些与运动执行和控制及其他功能活动相关的脑区参与了算法的构成。可以看出,小脑的不同位置在所有的分类器中都很重要。这一结果与前人研究结果较为符合。长期以来,小脑都被认为与运动功能相关。小脑从脊髓的感觉系统或皮质及皮层下区域接收输入信号,并将这些信号整合,对运动进行微调[7]。此外,小脑对运动计时[31]、预测动作[32]、肢体随意运动以及经典条件反射[33]等功能也有重要作用。小脑还是一个主要参与运动学习的区域[34]。亓丰学等[35]研究发现,经颅直流电刺激小脑可以改善人体的运动表现,如姿势控制、运动适应与运动学习、肌肉力量表现等。随着fMRI技术的发展,研究者发现长期运动技能训练会导致小脑发生结构可塑性以及功能重组。例如,职业羽毛球运动员小脑灰质密度明显高于普通人[36],世界级登山运动员小脑蚓状小叶I-V的体积显著高于对照组[37],世界级体操运动员小脑网络存在模块间和模块内重组[38],优秀滑冰运动员小脑功能活动发生重组[39]。研究结果验证了长期运动技能训练对小脑的影响,并提示射击运动和滑冰运动对小脑不同区域的影响不同。研究者给小脑划定了不同的功能分区,与大脑和脊髓有着不同的连接,其中前庭小脑控制平衡和眼球运动,脊髓小脑调节正在进行的动作,皮层小脑协调运动的计划[40]。然而运动领域目前较少有研究者对小脑的亚区进行切分研究。Park等[41]曾在对篮球运动员的研究中指出,虽然小脑整体未见宏观可塑性,但小脑的详细切分显示了差异,篮球运动员的小脑蚓_4_5形态学显著增大。结合研究结果可以推测,未来对运动员小脑进行功能划分,进一步探索每个小脑亚区在动作控制与执行中的作用也是重要的研究方向。

表3 为分类算法贡献最高的10个脑区Table 3 Top ten brain regions contributing to the classification algorithms

SVM算法在对高水平运动员和非运动员对照组进行分类时,占权重最高的脑区除了小脑之外,还包括扣带回、角回、颞极、额叶(眶部、岛盖部、三角部额叶)、丘脑、豆状核、杏仁核、舌回、枕叶以及嗅皮质等脑区,这些脑区在之前用常规的fMRI处理方法报道的结果中有着部分体现。占权重最高的脑区可能是高水平运动员和非运动员之间在脑功能上的主要差异所在。通过识别这些脑区,一方面,可以帮助精确定位与特定运动技能或训练相关的脑区。这有助于加深对脑与运动之间关系的理解,为运动科学和神经科学领域提供重要线索;另一方面,权重最大的脑区的功能状态与高水平运动员的优势技能或特定训练任务相关。这为优化运动训练和干预策略提供了依据。教练和训练团队可以根据这些脑区的功能特征,设计更加针对性和有效的训练方法,提高运动员的竞技水平。 此外,这些脑区还可能发展成为高水平运动员的生物标记(biomarker)的潜在候选区域。总之,在将来,应用模式识别算法的技术有望为教练和训练团队制定个性化的训练方案提供指导,使训练更加精准和有效。

4 结论

首次使用模式识别中的SVM分类算法对高水平射击运动员、高水平滑冰运动员及非运动员对照组的脑静息态功能磁共振数据进行训练和分类,选择fALFF、ReHo和DC作为分类特征,取得了较高的分类准确性和较好的分类效果。该研究证实了模式识别方法在运动科学领域的重要应用价值,研究成果有助于体育科学研究者采用新的分析工具,从新的角度更加全面地理解运动与脑的关系,对运动认知学科这门新学科领域的发展具有指导意义和实践价值。

猜你喜欢
模式识别小脑脑区
新生儿小脑发育与胎龄的相关性研究
脑自发性神经振荡低频振幅表征脑功能网络静息态信息流
动动小手和小脑
说谎更费脑细胞
浅谈模式识别在图像识别中的应用
哈哈哈哈,请跟着我大声念出来
第四届亚洲模式识别会议
1例以小脑病变为主要表现的Fahr’s病报道并文献复习
七氟烷对幼鼠MAC的测定及不同脑区PARP-1的影响
第3届亚洲模式识别会议