无监督网络入侵检测研究 前导知识

根据立项书和论文,总结了研究领域的一部分基础知识。

入侵检测系统 (IDS)

IDS(入侵检测系统)是一种安全工具,旨在检测计算机系统、网络或应用程序中的恶意活动和安全漏洞。它通过监视计算机系统、网络或应用程序的活动来检测潜在的入侵行为,并发出警报以通知管理员采取适当的措施。

  • NIDS(Network- based intrusion detection system)

IDS 分类:

1. 基于特征的系统 (signature-based system)

要求根据以前的攻击知识来产生一个准确的特征。特征可以是预定义的,也可以通过机器学习算法自动提取。

2. 基于异常的系统 (anomaly-based system)

不依赖现有攻击的以前知识,可以检测到未知攻击,具有较好的自适应性,但可能存在较高的误报率。

图神经网络(Graph Neural Networks,GNN)

GNN是深度学习在图结构上的一个分支。GNN是一种连接模型,通过网络中节点之间的信息传递的方式来获取图中的依存关系,GNN通过从节点任意深度的邻居来更新该节点状态,这个状态能够表示状态信息。

GNN是对图上的所有属性进行的一个可以优化的变换,它的输入是一个图,输出也是个图。可以把图神经网络看做是一个图数据的在三个维度的特征提取器。

  • 图卷积网络(Graph Convolution Networks,GCN)

将卷积运算从传统数据(例如图像)推广到图数据。

  • 图注意力网络(Graph Attention Networks)

  • 图的自编码(Graph Autoencoders)

    该模型通常使用无监督学习(unsupervised)的方式。

不同GNN的本质差别就在于它们如何进行节点之间的信息传递和计算,也就是它们的消息传递机制不同。

无监督学习 (Unsupervised Learning)

监督学习:一种目的明确的训练方式,通过已知因素和已知的结果,通过机器训练,使机器能学会通过已知因素得到未知的结果。

无监督学习:没有给定事先标记过的训练示例,自动对输入的资料进行分类或分群,再根据这些数据分析这些数据的特征。本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。

无监督学习的主要运用包含:聚类分析(cluster analysis)、关系规则(association rule)、维度缩减(dimensionality reduce)。

特点:

  • 没有明确的目的

  • 不需要给数据打标签

  • 无法量化效果

常见的两类无监督算法:

  • 聚类

简单说就是一种自动分类的方法,在监督学习中,你很清楚每一个分类是什么,但是聚类则不是,你并不清楚聚类后的几个分类每个代表什么意思。

  • 降维

降维看上去很像压缩。这是为了在尽可能保存相关的结构的同时降低数据的复杂度。

扩散模型(Diffusion Models)

用于图像生成。实现从噪声(采样自简单的分布)生成目标数据样本。

扩散模型包括两个过程:前向过程(forward process)和反向过程(reverse process),其中前向过程又称为扩散过程(diffusion process)。无论是前向过程还是反向过程都是一个参数化的马尔可夫链(Markov chain),其中反向过程可用于生成数据样本。

参考:扩散模型之DDPM - 知乎 (zhihu.com)