基于NLP和聚类的服务器异常日志检测

李 岩 ( 深圳证券交易所 )

龚向宇 ( 红帽软件(北京)有限公司 )

https://doi.org/10.37155/2717-5170-0502-58

Abstract

数据中心服务器多年下来累计了海量的日志,里面有很多的异常模式,如何用自然语言处理( NLP)的 方法对这些数据进行管理和组织,并进行必要的分类,从而为后续的运维工作提供参考。我们方法的核心在于为每个 日志文件创建一个异常字典,从而生成与该特定服务中异常的语义区域密切相关的特征矩阵。然后使用聚类算法通过 模型训练优化模型参数,从而在模型稳定后对新来的日志进行聚类预测,以识别出异常的日志。

Keywords

自然语言处理; 聚类 ;日志分析; 异常检测

Full Text

PDF

References

[1]程云观等,一种云环境下的高效异常检测策略研
究,计算机应用与软件37( 1), 327-333
[2]霍文君,一种基于聚类的系统日志解析算法计算
机科学与应用, 2020, 10(1)
[3]黄承慧等,一种利用TF-IDF方法结合词汇语义信
息的文本相似度量方法研究,计算机学报, 2011( 5),
856—864
[4]李岩, 吴智铭,一种混合 GA, SA 和启发式规
则的 FMS 调度方法,上海交通大学学报 2001, 33 (11),
1329-1332

Copyright © 2023 李 岩,龚向宇 Creative Commons License Publishing time:2023-04-21
This work is licensed under a Creative Commons Attribution 4.0 International License