时序感知的异质图神经谣言检测

2024-02-28 08:18陈林威宋玉蓉

小型微型计算机系统 2024年1期

陈林威,宋玉蓉,宋波

1(南京邮电大学自动化学院、人工智能学院,南京 210023)

2(南京邮电大学现代邮政学院,南京 210003)

0 引言

随着互联网技术的快速发展和移动设备的广泛使用,微博、Facebook等一批在线社交媒体,逐渐成为大众信息消费的主要载体.社交媒体平台的开放性和便捷性为人们提供了自由表达的空间,但这也间接为虚假信息的传播提供了理想场所.在这里,谣言被定义为一种未经证实或故意发布的虚假消息[1].谣言的传播会引起公众的恐慌,对社会稳定造成巨大威胁.尤其在疫情期间,大量新的谣言不断涌现,例如“粮食短缺,赶紧屯粮”、“新冠抗体可使人免受‘二次感染’”等谣言信息广为散布,这无疑会误导群众,一定程度上影响社会秩序.因此,如何准确、快速地识别谣言是亟待解决的问题.

早期的谣言检测方法大多利用特征工程从文本内容[2]、用户配置信息[3]和传播结构[4-6]等方面挖掘有效特征.这类方法依赖繁琐的特征工程,耗时耗力,并且人工设计的特征无法表达更深层的特征,大大限制了模型的检测性能.随着深度学习算法的发展,神经网络在自然语言处理领域中取得了十分显著的效果.受此启发,研究学者们开始利用深度学习模型对文本内容、用户、传播结构等进行建模,自动学习这些信息的高阶特征表示[7-11].最近,基于图模型的方法[12-15]将事件的传播结构抽象为图结构,并利用图神经网络学习事件的特征表示,有效提高了谣言检测的准确率.但这些方法只考虑到事件内部帖子的局部传播结构,忽略了事件在社交媒体上的全局结构关系.Yuan等人[16]认为每个事件都不是独立的个体,事件与事件之间可能因为相同用户的参与而产生联系,只考虑每个事件本身的特征而忽略事件之间的联系,势必会限制模型的检测性能.因此,他们从异构网络的视角研究事件与事件之间的关联,提出了一个联合全局与局部关系的异质图来捕获消息传播的局部语义关系和全局结构信息.尽管该模型取得了良好的效果,但他们忽略了事件内部消息传播过程中的时序信息.事实上,在现实的消息传播过程中,每个时间阶段发布的转发(或评论)贴可能有不同的含义.例如,在源贴刚发布不久,由于其没有被证实,所以表示怀疑的转发(或评论)贴可能更多;在消息传播的后期阶段,由于官方的辟谣以及事件真相的逐渐显露,人们的态度随之发生改变.对于谣言事件,人们更多的转变为反对的态度,而对于非谣言事件,则越来越多的人开始肯定该言论.并且,用户发布帖子除了受源贴的影响,还可能受到其他已发帖子的影响,进而干扰其判断.因此,本文认为有必要挖掘消息传播过程中的时序信息,以捕获谣言与非谣言在不同时间阶段产生的响应贴的差异性以及响应贴之间潜在的时序依赖关系.

基于这些观察,本文考虑同时建模事件与事件之间的全局结构关系以及事件内部消息传播的时序关系,提出一种时序感知的异质图神经谣言检测模型.本文首先基于谣言检测数据集构建一张事件-用户异质图模拟消息在真实社交媒体上的传播;然后,通过位置编码建模事件内部转发(或评论)帖之间的局部时序关系,结合多头注意力机制关注重要的响应贴,并将具有时序信息的响应贴与源贴融合,得到事件节点的局部时序表征;接着利用元素级注意力机制捕捉事件与事件之间的全局结构关系,学习事件节点的全局结构表征;最后,将两种特征融合,得到最终的事件节点表示用于谣言检测.本文的主要贡献如下:

1)本文同时考虑事件与事件之间的全局结构关系以及事件内部消息传播的时序关系,以异质图为载体共同显式建模两种关系;

2)本文基于转发(或评论)贴与源贴的交互时间构建响应序列,并通过时序感知的自注意力机制挖掘事件内部的时序信息,然后融合源贴和响应贴的表示,得到每个事件节点的局部时序表征;

3)本文基于用户与事件的交互关系,利用元素级注意力机制学习每个事件节点的全局结构表征,以捕获复杂多样的传播结构特征;

4)本文在3个公开的真实数据集上验证方法的有效性.实验结果表明,本文模型优于现有最先进的谣言检测模型,并且具有更高的早期检测性能.

1 相关工作

谣言检测的研究最早是基于帖子的内容信息展开,致力于挖掘文本特征,捕获谣言与非谣言在内容上的差异.但考虑到谣言的发布者常常刻意效仿真实消息的语言风格,导致单纯基于内容的方法无法捕捉有效的特征进行谣言识别.随后的一些研究工作开始从消息的传播结构特征着手,捕获谣言事件与非谣言事件在传播模式上的差异,取得了良好的效果.本文将现有的谣言检测方法大致分为:1)基于内容的谣言检测方法;2)基于传播结构的谣言检测方法.

1.1 基于内容的谣言检测方法

早期基于内容的谣言检测的研究工作主要集中在人工设计特征上,再结合如逻辑回归、决策树等分类算法对消息的真实性进行判别.Wu等人[17]利用狄利克雷分布(Latent Dirichlet Allocation,LDA)生成文本的主题,并基于随机游走图核的SVM算法在微博数据上进行谣言检测;Sun等人[18]提取了描述事件的动词数、包含事件动词的消息比例、是否包含强消极词以及包含强消极词的消息比例4种新的文本特征,并利用决策树分类算法用于谣言检测.这类方法均基于繁重的手工特征提取,只能挖掘谣言的浅层特征,无法进一步提升谣言检测的精度.伴随着深度学习的快速发展,各类模型结构层出不穷,神经网络不断加深使得网络能够对特征进行充分挖掘,降低了对人工设计特征的要求,谣言检测方向也逐渐从特征挖掘迁移到模型结构设计上.Yu等人[19]、Liu等人[20]将卷积神经网络(Convolutional Neural Network,CNN)应用于谣言检测问题,通过CNN自动生成高阶抽象特征,对事件的表示进行学习,提升了谣言检测精度;Zhang等人[21]利用注意力模型分别学习文本内容和情感符号的特征表示,并将二者融合的结果作为微博文本的语义表示,一定程度上丰富了微博文本的情感语义信息;Pan等人[22]结合文本卷积神经网络(Text CNN)与引入注意力机制,通过注意力机制对Text CNN学习到的文本表示进行加权输出,提取更为显著的微博文本特征.虽然这类方法取得了一定效果,但目前的谣言发布者常常会通过刻意模仿真实消息的写作手法、表达风格等途径达到逃避检测的目的.这就导致仅依赖于文本内容的方法无法捕捉有效特征进行谣言的识别.

1.2 基于传播结构的谣言检测方法

基于传播结构的方法重点关注的是谣言事件与非谣言事件传播特征之间的差异.Ma等人[7]考虑消息在传播过程的时序特征,首次提出利用循环神经网络(Recurrent Neural Network,RNN)捕获每个源贴及其转发(或评论)贴的语义变化,并根据语义变化进行预测,这也是第一次引入深度学习模型进行谣言检测的研究;而后,Ma等人[8]又探究了一种基于树的递归神经网络(RvNN),分别建模自顶向下和自底向上的消息传播树,用以捕捉源贴的语义信息和传播结构信息;Liao等[9]提取文本的潜在特征和局部的用户特征,并利用带有注意力机制的双向GRU网络学习微博事件的表示;Chen等人[10]将RNN与注意力机制结合,捕获消息传播过程中的语义变化,一定程度上提高了谣言检测性能.这些方法大多只关注到事件内部的时间变化,将消息的传播结构构建为时间序列,忽略了帖子之间显式的转发(评论)关系.基于此,Bian等人[13]根据帖子之间的转发(或评论)关系将传播结构构建成图结构,通过双向图卷积网络(Bi-Directional Graph Convolution Network,Bi-GCN)学习消息转发的结构特征;Hu等[14]基于消息传播树中蕴含的层间依赖关系与层内依赖关系,利用多关系图卷积网络共同建模两种关系,以捕获更为丰富的传播结构特征.这些方法虽然取得了不错的效果,但终究只关注到消息的局部传播,即认为每个事件都是独立的,没有考虑到事件与事件之间的关联,忽略了全局结构信息.而Yuan等人[16]则考虑到事件的全局结构特征,探究了一个联合全局与局部关系的异构网络来捕获消息传播的局部语义关系和全局结构信息,取得了良好的效果.但其忽略了事件内部重要的时序关系.

本文以异质图为载体,同时融合局部时序关系和全局结构关系,提出了一种时序感知的异质图神经谣言检测方法,共同显式建模局部时序信息和全局结构信息,为事件节点学习更全面的特征表示,用于提升谣言的识别能力.

2 模型方法

2.1 问题描述

设C={c1,c2,…,c|C|}为谣言事件集,其中,ci为第i个事件样本,|C|为事件集的大小,即事件总数.对于每个ci事件,都包括1条源贴mi和n条相关的转发(评论)贴,记为ci={mi,ri,1,ri,2,…,ri,n}.此外,本文定义U={u1,u2,…,u|U|}表示社交媒体中参与事件的用户集合,其中|U|为数据集中用户的总数量.

谣言检测任务可以描述为机器学习中的分类任务,将每个事件ci标注为对应的真实标签yi∈y,y为类别标签集.本文的目标是学习一个函数f:f(ci)→yi来预测当前事件是否为谣言.

2.2 模型介绍

本文提出的谣言检测模型主要由异质图构建、局部时序信息编码、全局结构信息编码和谣言分类4个模块组成.总体框架如图1所示.首先,在异质图构建模块(模块1)中,本文基于谣言检测数据集构建事件-用户异质图,并利用嵌入技术对图中各节点进行初始化表示;其次,在局部时序信息编码模块(模块2)中,本文基于事件内部转发(或评论)贴之间的时序关系,利用时序感知的自注意力机制学习具有时序信息的响应贴表示,再融合源贴本身的内容信息,得到每个事件节点的局部时序表征;在全局结构信息编码模块(模块3)中,本文基于用户与事件之间的交互关系,利用元素级注意力机制学习每个事件节点的全局结构表征;最后,在谣言分类模块(模块4)中,本文融合事件的局部时序表征与全局结构表征,以预测当前事件为谣言的概率.接下来,本文将详细介绍每个模块.为简化说明,本文在后续的描述中,将“转发(或评论)贴”均替代为“响应贴”.

图1 SHGN模型总体框架Fig.1 Overall architecture of the SHGN model

1)异质图构建

本文将事件以及相关用户抽象为网络中两种不同类型的节点,并根据用户对事件的参与情况(用户对事件中的帖子存在转发或评论的行为),建立用户节点与事件节点的连边关系.此外,在每个事件内部又包含一条源贴和一系列响应贴.根据响应贴在源贴发布后的时间延迟,将响应贴构建为时间序列,这样每条源贴就对应一个响应序列.如图1中模块1所示,最终构建为具有时序信息的事件-用户异质图.

接下来,对异质图中的各节点进行初始化.首先对于事件节点,其内部本质是源贴和响应贴的文本内容.而社交媒体中大多是短文本数据,由几个到几十个单词组成,长度短、内容少;并且在文本语义方面,谣言发布者常常刻意模仿真实消息的写作风格.这些因素都会导致模型无法挖掘有效的语义信息进行谣言检测.目前主流的从词向量序列中学习文本语义表示的模型包括卷积神经网络、循环神经网络等.相比之下,RNN等序列模型更适用于长文本的内容特征提取,对社交帖子这类短文本数据而言,数据稀疏问题不可避免地影响模型性能;而CNN具有关注局部语义信息的特点,在处理短文本的效果上比RNN好.

因此,本文采用词向量的方式初始化,并利用CNN对其进行编码.具体而言,固定每个帖子的单词数量为L个,当单词数量小于L时,用0填充;当单词数量超过L时,则截断.接着通过Word2Vec算法[23]在特定领域的语料库上进行训练,得到每个单词的向量表示,对于预训练词向量库中没有出现的单词,本文使用均匀分布进行初始化,并且保持词向量在训练过程中可微调.记每个单词的初始向量为xj∈d,j表示帖子中的第j个单词,则每条单词数量为L的帖子可表示为:

(1)

其中,“;”为拼接操作,x1:L∈L×d.

进一步地,本文利用CNN对句子序列进行编码.给定一个由单词向量组成的句子序列x1:L,通过CNN的卷积层对每个可能的窗口做一维卷积操作:

ei=σ(W*xi:i+h-1)

(2)

得到特征图e=[e1,e2,…,eL-h+1]∈L-h+1.其中,W∈h×d是大小为h的卷积核,为sigmoid激活函数.接着利用最大池化操作选择每个特征图的最大值,再通过拼接操作得到每个帖子的初始向量表示.这样,对于第i个事件而言,其源贴表示为mi∈d,每条响应贴表示为ri,j∈d,将该事件中响应贴组成的矩阵记为Ri=[ri,1,ri,2,…,ri,n]∈n×d.

另一方面,对于用户节点的初始化,本文对用户的属性信息(包括性别、年龄、粉丝数、关注数等)进行编码,得到用户节点的初始化向量表示.对于获取不到的用户信息,本文通过正态分布进行初始化.

2)局部时序信息编码

受Transformer模型[24]的启发,本文采用时序感知的自注意力机制挖掘事件内部的局部时序信息,捕获谣言事件与非谣言事件在不同时间阶段产生的响应贴的差异以及响应贴之间潜在的时序依赖关系.

首先,为了编码每条响应贴的时延信息,本文使用Transformer模型中的位置编码(Positional Encoding,PE)公式为每条响应贴生成一个位置嵌入P∈|P|×d:

(3)

(4)

其中,pos表示响应贴在序列中的位置,d表示位置嵌入的维度,2k表示偶数的维度,2k+1表示奇数维度(即2k≤d,2k+1≤d).

接着将每条响应贴的嵌入与其对应的位置嵌入相关联,以捕获响应贴之间的时序信息:

(5)

其次,利用多头注意力机制对重要的响应贴进行重点关注.自注意力机制能够自动学习自己与上下文之间的相关性,捕获重要的上下文信息,而多头则可以考虑多方面的影响因素,获得更为全面的节点表示:

(6)

(7)

αii=softmax(LeakyReLU(aT[mi;mi]))

(8)

(9)

(10)

其中,αii、αij分别表示节点i与自身以及节点i与节点j之间的注意力分数,N(mi)为节点i的邻居节点,即当前源贴对应的所有响应贴,W∈d(l+1)×dl为该层节点特征变换的权重参数.

3)全局结构信息编码

对于参与到事件ci中的特定用户uj∈d,计算用户uj在不同方面的注意力向量γj:

γj=tanh(Wcuj+b)

(11)

其中,Wc∈d×d为特征变换矩阵,是不同方面的注意力向量.越大,表示用户嵌入uj的第k个方面对消息传播的影响越大.

接着,将注意力向量γj与参与到事件ci中的所有用户以元素乘积方式进行聚合,以捕获事件与事件之间的全局结构关系:

(12)

4)谣言分类

经过上面的过程,可以得到每个事件节点的局部时序表示和全局结构表示,二者对谣言检测都至关重要.本文将两种特征进行拼接作为事件节点的最终表示,并经过全连接层和softmax函数计算该事件的预测结果,即该事件为各个标签的概率值:

(13)

其中,Fc(·)表示全连接层,输出的维度与标签的类别一致.

最后,为了训练模型的参数,本文采用交叉熵损失作为模型的目标优化函数:

(14)

其中,θ为模型的所有参数,r为样本标签的类别数,yi∈{0,1,2,3}(Twitter),yi∈{0,1}(Weibo)为真实的标签值.

3 实验结果与分析

3.1 实验数据及设置

1)实验数据

本文在Twitter15[6]、Twitter16[6]和Weibo[7]3个公开的真实数据集上对提出模型的有效性进行评估.所有标签都是由辟谣网站中文章的真实标签获取.其中,Twitter15和Twitter16数据集有4种标签类别,分别是非谣言(non-rumor,NR)、假谣言(false rumor,FR)、真谣言(true rumor,TR)、未经证实的谣言(unverified rumor,UR);Weibo数据集包含2种标签,分别是真谣言(true rumor,TR)和假谣言(false rumor,FR).详细的统计情况如表1所示.

表1 数据集统计Table 1 Dataset statistics

2)评价指标及参数设置

为了公平验证本文模型的有效性,本文采用与之前研究一致的评估指标[16],分别是准确率、F1分数、召回率和精准率.模型中的参数由Adam算法更新,其参数β1、β2分别设置为0.9和0.999,学习率初始化为1e-3,在训练过程中逐渐降低.模型中的词嵌入和用户初始化嵌入都是300维,dropout比率设置为0.2.CNN卷积核大小设置为(3,4,5),每组100个.多头注意力机制的K设置为8.实验的batchsize设置为64,epoch设置为30.所有代码均由Pytorch实现,所有的实验结果都是在5次实验的结果上取平均.

3.2 对比方法

本文选取了一些最先进的基线模型在相同的数据集上进行实验和比较,所选取的基线模型如下:

1)DTC模型[3].该模型基于特征工程,人工设计文本内容特征和用户特征,并利用决策树分类器进行谣言检测任务.

2)SVM-RBF模型[2].该模型基于帖子的总体统计数据,手工构造特征,并利用基于RBF内核的支持向量机进行谣言检测.

3)CAMI模型[19].该模型将段落向量作为CNN的输入,自动学习文本的深层特征进行谣言检测.

4)GRU模型[7].该模型基于消息的传播序列,并利用GRU学习事件的传播结构特征,进而完成谣言检测任务.

5)RvNN模型[8].该模型利用树结构的递归神经网络,对树状的消息传播模式建模,从而完成谣言检测任务.

6)Bi-GCN模型[13].该模型基于消息的传播方向和扩散方向建立传播树,并利用双向图卷积神经网络学习节点表示,进行谣言检测.

7)GLAN模型[16].该模型基于异质图同时捕获事件的局部语义信息和全局结构信息,进而完成谣言检测任务.

3.3 结果与分析

本文通过实验得到本文模型及所有对比方法在3个数据集上的性能,如表2～表4所示.其中,Acc表示分类的总体准确率(accuracy,Acc).实验结果证明,本文提出的SHGN模型要优于其他基线模型,且检测的准确率和精度都得到显著提高.下面对实验结果进行具体分析:

表2 Twitter15数据集上的实验结果Table 2 Experimental results on Twitter15 dataset

表3 Twitter16数据集上的实验结果Table 3 Experimental results on Twitter16 dataset

表4 Weibo数据集上的实验结果Table 4 Experimental results on Weibo dataset

1)相比基于传播结构的谣言检测方法(GRU、RvNN、Bi-GCN、GLAN以及SHGN),基于内容的方法(DTC、SVM-RBF、CAMI)性能整体较差.这是因为社交帖子具有内容少、噪声多的特点,导致模型无法充分提取有效的语义特征进行谣言识别,而基于传播结构的模型主要侧重于挖掘谣言事件与非谣言事件传播特征之间的差异,通过捕捉复杂多样的传播特征提高检测性能.可以观察到,相比于基于内容的模型中表现最佳的CAMI模型,SHGN结果更好,在Twitter15数据集上其准确率要比CAMI模型高21.1%,在Twitter16数据集上的准确率要比CAMI模型高17.9%,在Weibo数据集上的准确率要比CAMI模型高2.5%.实验结果证明了本文模型的优势以及传播结构特征对于谣言检测任务的重要性和必要性.

2)在所有基于传播结构的基线模型中,GLAN模型表现最佳.这是因为GLAN考虑了消息在真实社交媒体中复杂多样的传播过程,以异质图为载体同时建模局部语义信息和全局结构信息进行谣言检测,而GRU模型将消息传播建模为传播序列以及Bi-GCN模型将消息传播建模为传播图,都只考虑局部的结构特征,忽略了事件与事件之间的关联,无法捕获全局结构信息.这也表明,将谣言检测任务建模为异质图以捕获全局结构信息的方法要优于通过建模为传播序列或传播树捕获局部结构信息的方法.而相比于GLAN模型,本文提出的SHGN模型结果更好,在Twitter15数据集上其准确率要比GLAN模型高2.2%,在Twitter16数据集上的准确率要比GLAN模型高2.1%,在Weibo数据集上的准确率要比GLAN模型高1.2%.这是因为SHGN模型通过引入位置编码弥补了GLAN模型忽略的局部时序信息.由此证明局部的时序关系在谣言检测中至关重要,捕获局部结构中的时序信息有助于提高谣言检测的性能.

3.4 消融实验

为了验证局部时序信息和全局结构信息对提高谣言检测性能均有贡献,本文进行了一系列消融实验,主要包括3个部分:

1)w/o LSE(Local Sequence Embedding):移除局部时序信息编码模块,仅考虑全局结构信息.

2)w/o GSE(Global Structure Embedding):移除全局结构信息编码模块,仅考虑局部时序信息.

3)w/o PE:移除位置编码,即没有引入局部结构中的时序边,仅使用多头注意力机制捕获局部语义信息,主要用于验证局部传播结构中时序边对谣言检测的有效性.

消融实验的结果如图2所示,其中ALL为原始的SHGN模型.根据表中的实验结果,可以得到以下结论:

图2 SHGN在3个数据集上的消融实验结果Fig 2 Ablation experiment result of the SHGN on three datasets

首先,本文研究了局部时序编码模块对谣言检测的影响.可以观察到,移除LSE模块显著影响SHGN模型在3个数据集上的性能,准确率在Twitter15和Twitter16数据集上分别下降了7.6%和6.9%,在Weibo数据集上下降了8.5%.实验结果证明了建模局部时序关系的有效性.这也说明,随着时间推移,人们态度的转变对于不同事件确实存在差异,并且较早发表的言论对某些用户也确实存在一定影响.因此,局部时序编码模块能够捕获到谣言事件与非谣言事件在不同时间阶段产生的响应贴的差异性以及响应贴之间潜在的时序依赖关系,对谣言检测至关重要.

其次,本文研究了全局结构编码模块对谣言检测的影响.社交媒体事件不是独立存在的,事件与事件之间因相同的用户建立起全局关联.直观地说,建模全局结构关系能够使谣言事件与非谣言事件具有高凝聚性和低耦合性,从而提高谣言检测性能.可以观察到,GSE模块的移除导致模型在3个数据集上的性能下降,准确率在Twitter15和Twitter16数据集上分别下降了6.7%和4.6%,在Weibo数据集上下降了7.7%.实验结果同样可以证明建模全局结构关系的有效性,事件的全局结构关系对于谣言检测亦是不可或缺.

此外,本文还通过评估位置编码的有效性,证明了事件内部的消息不仅仅只有显式的关联关系,还具有潜在的时序依赖关系.仅使用多头注意力机制虽然可以捕获任意响应贴之间的影响,但是其本身不能表达位置信息,即无法捕获响应贴在传播过程中蕴含的时序依赖关系,而加入位置编码可以显式地编码各响应贴在消息传播序列中的相对位置,从而捕获到消息传播过程中的上下文信息.可以观察到,SHGN在没有加入位置编码的模型中,准确率在Twitter15和Twitter16数据集上分别下降了3.4%和2.4%,在Weibo数据集上下降了2.5%.因此,事件内部的消息确实具有潜在的时序关系,引入位置编码捕获事件局部的时序信息能够有效提高该场景下的检测能力.

3.5 早期检测研究

早期检测是指在消息传播的早期阶段进行谣言识别,以便及时采取措施,减少谣言传播,这是评价谣言检测方法质量的另一个重要指标.为了验证本模型具有优秀的早期检测性能,本文在Twitter15和Twitter16这2个数据集上进行了早期谣言检测实验.具体而言,本文分别选取了源贴发布后的4h、8h、12h、24h作为时间节点,代表不同的时间阶段,截取这些时间段内的响应帖以及相关用户作为早期数据.同样,本文选取了DTC、GRU、RvNN、Bi-GCN、GLAN 5个基线模型进行对比,来评估本文模型的性能.实验结果如图3和图4所示.可以看出,本文的SHGN模型使用不到4个小时的数据,在2个数据集上的准确率就达到90%以上,超过了其他基线模型,短时间内的高准确率表明本文模型具有优越的早期检测性能.随着时间的推移,本文的SHGN模型和GLAN模型在4h到12h之间准确率有轻微波动,这是因为随着消息的传播,会有更多复杂的信息加入,不可避免地给模型带来噪声信息.而对于早期检测任务,一个优秀的模型应该尽可能早的达到高指标的检测效果.因此,可以判定本文提出的模型在早期检测任务上比GLAN模型更优,也进一步表明本文模型对数据具有更强的鲁棒性和更稳定的性能.综上所述,在2个真实世界的Twitter数据集上的实验结果表明,本文提出的方法在早期谣言检测方面比最先进的基线模型具有更好的性能.

图3 Twitter15数据集上早期检测实验结果Fig.3 Experimental results of early detection on Twitter15 dataset

图4 Twitter16数据集上早期检测实验结果Fig.4 Experimental results of early detection on Twitter16 dataset

4 总结与展望

本文提出了一个时序感知的异质图神经谣言检测模型.该模型通过位置编码建模事件内部响应贴之间的时序关系,并利用多头注意力机制关注重要的响应贴,然后利用图注意力机制的聚合函数融合源贴和响应贴,得到事件的局部时序表征;接着,基于用户与事件之间的交互关系,利用元素级注意力机制学习事件的全局结构表征;最后,将两种特征表示拼接用于谣言分类.实验结果表明,本文提出的SHGN模型优于最先进的谣言检测方法,并且在早期检测任务上,也具有更高的检测性能.

在未来的研究中,本文将主要从3个方面继续深入工作:1)在局部结构的构建方面,寻找更加合适的建模方法(如根据转发、评论关系构建具有时序边的消息传播树),用以捕获更为丰富的消息传播结构;2)在算法层面,寻找合适的异质图嵌入算法,充分利用异质图带来的丰富异质信息以及不同类型节点之间的交互关系;3)由于社交媒体资源的多样性,本文还将考虑利用音频、图像等多模态信息以提高谣言检测性能.