基于改进朴素贝叶斯算法入侵检测系统研究

2017-11-15 12:42曾国斌冉兆春

电脑知识与技术 2017年28期

关键词：检测系统

曾国斌+冉兆春

摘要：虽然互联网应用已经普及，但是经常发生入侵事件，为了保证上网的安全性，开始对改进朴素贝叶斯算法入侵检测系统进行研究。在试验中也证明这一方法有效，完全可以使用，下面就进行深入的分析。

关键词：朴素贝叶斯；算法入侵；检测系统

中图分类号：TP393 文献标识码：A 文章编号：1009-3044（2017）28-0028-02

网络攻击事件增多，对网络安全产生重要影响，很多用户的文件丢失，为了控制恶意攻击事件，技术人员引入了改进朴素贝叶斯算法入侵检测系统，那么就分析该算法的原理，分析具体的检测过程，希望得到认可。

1 对朴素贝叶斯算法的分析

对于朴素贝叶斯算法而言，具体应用中先要进行一个简单的假设，然后构建贝叶斯方法，NB需要假定样本特征、属性，这两点不会对样本的归类产生影响，因此相互之间都是没有关联的，是相互独立存在的。对于朴素贝叶斯分类器而言，建立在贝叶斯定理基础上的一种应用，当前在过滤垃圾邮件、信息领域、识别模式中应用，除此之外，还可以进行入侵检测。相关技术人员选用朴素贝叶斯分类器原因非常简单，其在使用中进行数据训练数量有限，不需要进行大量数据的运算，就可以得到必要的参数，同时不会对已经缺失的数据敏感，也就是运算中不会被缺失的数据所影响，保证最终结果的准确性，对变量都是进行独立假设的，变量相互之间没有太多的联系，对变量进行估算即可，因此优势明显，得到很多一线计算人员的认可[1]。

2 研究改进朴素贝叶斯算法入侵检测系统

2.1 分析改进NB分类模型

对于分析中应用的贝叶斯决策理论而言，相关人员要清楚其核心思想就是通过先验概率估计之后再验概率。对于其分类模型而言，主要是以贝叶斯决策理论作为基础，该模型属于被简化之后的贝叶斯概率模型，应用这种分类模型优势十分明显，例如分类准确性很高、操作速度快、整个工作比较简单。当前该模式的应用非常广泛，而且得到了相关人员的一致好评。

2.2 具体分析原理

设定样本A=（a1，a2，…，an）是n维布尔向量，可以表示在网络事件中A的具体中特征ai是否出现过。具体判断是C∈（C1，C2，…，Cm，f），属于m个问题，映射函数f：Ai→ Cj，未确定事件实例Ai，属于m个类别中的一个。训练样本：X1，X2，…，XN，X=（x1，x2，…，xt）是t维布尔向量，属于c1，c2，…，ck，是k个事件标签。网络样本没有分类，需要进行分类，Yi=（y1，y2，…，yn）∈（Y1，Y2，…，YN，Cj），属于每个类别的概率情况。对训练样本中类别c j的概率P（c，j）进行估计，通过模型建立NBM 结构，要注意所有待分类节点Ai都隶属于共有类别节点C，在此基础上，每一个待分类节点之间的关系也是相互独立的，可以根据下图进行细致分析。在这一关系模型中可以发现，每一个节点之间的联系都可以反映出贝叶斯决策的核心理论，一就是先验概率估计之后再验概率。在此之后，利用后验概率对新的样本进行更新，在这一模型中进行集合节点的训练和学习，最终就可以计算出最大可能性的分类情况。由此可见，之前进行的独立假设很多情况下都是错误的，但是通过结论得知可以得到很好的分类效果，这就说明这一分类模型的作用和优势，以及计算的准确性。下图就是NBC的结构示意图，相关人员可以参考进行分析[2]。

在此基础上，还有一种属性加值算法NBC，单纯从理论方面分析，利用计算出待分类节点所属类别的最大后验概率MAP，用其确定最后的节点cj。具体落实中存在很多问题，受到不同因素的影响，特征样本节点不同，属性样本节点不同，得到的训练样本集合不同，导致分类精度下降，为了弥补这一算法的缺陷，相关人员必须在原有的算法基础上，继续引入一种新的模式，也就是属性加值算法，通过实践操作得知，结合这一算法就可以很好的保证NBC分类准确度，还可以降低分类误差，以此得到了广泛的应用。

2.3 分析NBC入侵检测流程

对于传统的入侵检测而言，先设计一种事件分类器，有效区分数据中的异常数据和正常数据，这样就可以对攻击问题进行报警。IDS可以对入侵事件进行检测，属于一种不确定性的行为，针对这一情况，非常适合使用朴素贝叶斯理论，可以很好地对不确定的概率事件精细分析，结合这一情况，研究IDS时就可以直接引入NBC的入侵检测技，可以达到理想的作用效果。根据这一问题，在研究中工作人员把NBC技术在入侵检测模型的分类模块中进行了使用，按照相关的流程进行一步步的处理，最终得到数据的归类集合，其具体的入侵流程可以参考下图。

3 结果分析

3.1 数据集分析

数据分析中使用了KDD Cup1999入侵检测数据集，在这一数据集中主要涵盖两个部分，第一部分，有5000000个网络记录下的七周内的训练数据，第二部分，2000000个网络记录下两周的数据，对于以此类型进行了细致划分，共分为了39种攻击类型，可以参考表1和表2进行分析[3]。

3.2 实验结果分析

进行实验时监理环境平台，变成工具是MATLAB8.0，进行入侵数据检查过程中，使用的数据是10%入侵检测数据集TrS、TeS，通过模拟试验就可以得到具体的结果，可以参考下表分析。分析中得知改进后的NB算法较传统的NB算法在对针网络入侵事件、分类的准确率、误检率都具有明显的提高。

4 总结

通过上述的分析可以发现，针对复杂的网络攻击，进行入侵测试属于不确定行为过程的组合，在检测中引入朴素贝叶斯决策理论分类器，达到了理想的效果，这一举措完全可行。在以后的发展中，还可以对这一检测技术进行改善。

参考文献：

[1] 王辉，陈泓予，刘淑芬.基于改进朴素贝叶斯算法的入侵检测系统[J].计算机科学，2014，41（04）：111-115.

[2] 周文刚，金鑫.基于树扩展朴素贝叶斯的高效网络入侵检测系统[J].北京师范大学学报：自然科学版，2007，43（1）：53-56.

[3] 姚潍，王娟，张胜利.基于决策树与朴素贝叶斯分類的入侵检测模型[J].计算机应用，2015，35（10）：2883-2885.endprint