摘要,相关工作,问题定义,模型建设等相关内容分解
树图思维导图提供 基于图卷积网络的多特征融合谣言检测方法 在线思维导图免费制作,点击“编辑”按钮,可对 基于图卷积网络的多特征融合谣言检测方法 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:d131aa8ad35b6263887849bb0f5a0154
基于图卷积网络的多特征融合谣言检测方法思维导图模板大纲
背景
1、忽略了原文本特征与其他特征的有效融合
2、忽略了传播用户在谣言传播过程中的作用
本文工作
基于传播结构和传播用户构建传播图,利用多个图卷积网络学习在不同用户属性组合的情况下传播图的表达,采用 BERT 模型学习原文本内容特征表达,最终与图卷积网络学习的特征相融合用于检测谣言。
机器学习方法
Ma提出了一个动态序列-时间结构的SVM分类器
Liu 等从消息的传播中提取了结构特征、时间特征、用户特征和内容特征 4 种类型的特征,并将这些特征和 Wu 等提取的特征相结合
深度学习方法
基于文本内容的谣言检测方法
Ma 首次基于传播内容利用循环神经网络学习微博文本的表达,捕捉文本上下文信息随时间的变化来检测谣言
Wang 等基于文本内容构建了图神经网络模型(SemSeq4FD)用于早期谣言检测
Ma 受到对抗性学习的启发,提出了一种基于生成 对抗的谣言检测方法
基于传播结构和文本内容的谣言检测方法
Ma 基于传播结构和文本内容,利用递归神经网络分别学习传播树中自顶向下的传播方向和自底向上的扩散方向上各节点的隐藏表达来检测谣言
Song 利用图神经网络从时间交互的角度捕捉谣言传播的动态演变模式
Bian 等通过图卷积网络学习图中的结构信息进行谣言分类
Lu 基于原文本和传播用户提出了图感知协同注 意网络(GCAN)谣言检测方法,
谣言定义:是指在社交媒体中传播的 与真实信息不符或故意伪造的信息,如错误信息和 虚信息
传播图定义:一条信息的所有转发用户之间的转发路径形成了树状结构,这种结构通常被称为传播树。 本文利用传播树结构和相应用户特征构建了传播图。
传播图特征表达模块
传播图的结构构建
博文 mi转发消息所对应的传播关系图,其中用户 u1和 u2 相继转发了原博文 si,在集合 Ei中则包含 e01、e10、e02和e20 ;u5 转发了 u1 ,则集合 Ei中则包含 e15和 e51 。
传播图的节点特征组合选择
传播图的特征表达,为 防止过拟合缩小参数矩阵的尺寸,在图卷积操作之 后加入一个平均池化层
子主题 1
原文本特征表达模块
词嵌入、句子嵌入、位置嵌入
编码层:将词嵌入层转换后的向量编码成具有丰富的上下文语义信息的序列向量
预测模块
6 组用户特征分别输入到 6 个 GCN中训练,再将传播图特征向量和原文本特征向量拼接:
数据集:公开微博数据集+爬取新浪微博 平台与新冠疫情相关的微博数据
基线实验
与 DTC、SVM 相比
机器学习依赖于手工提取特征,而深度学习能够自动捕获到更深层次的特征以及特征之间的关联,有助于提高谣言检测的性能
与LSTM相比
机器学习依赖于手工提取特征,而深度学习能够自动捕获到更深层次的特征以及特征之间的关联,有助于提高谣言检测的性能
BERBERT
图卷积网络模型能够有效学习到谣言和非谣言在传播结构和传播用户特征上的差异,能够进一步提升谣言检测的准确率
Bi-GCN
其忽略了传播过程中传播用户的重要影响。 本文模型中将传播用户特征作为传播树的节点特 征,学习谣言在传播过程中传播用户的影响
GCN-BERT
是 GCNs 未加入微博原文本特 征,说明原文本中包含着丰富且重要的信息,充分利 用原文本内容特征能有效提升模型的性能。
消融实验
用户特征组合分析
传播用户不同特征组合的影响分析
GCN 层数对模型性能的影响分析
本文研究了基于原文本内容、传播结构和传播用户相融合的谣言检测任务,提出了基于图卷积网络的多特征融合的谣言检测模型 GCNs-BERT。 该模型将传播结构特征与传播用户特征相融合,使用图卷积网络来学习传播用户和传播结构的表达,使用 BERT 模型学习原文本内容的表达,最后进行多特征融合来检测谣言。
使用图卷积网络进行谣言检测的优势
-自动提取图像中的谣言特征
-适用于多种类型的谣言检测
图卷积网络结构
-卷积层:提取图像特征
-池化层:减少特征维度
-全连接层:进行分类
谣言检测中的多特征融合方法
-文本特征:谣言文本内容提取的特征
-图像特征:基于图卷积网络提取的谣言图像特征
-时间特征:谣言传播的时间序