{“status”:“ok”,“message type”:“work”,“message version”:“1.0.0”,“message”:{“indexed”:{“date parts”:[[2024,6,8]],“date time”:“2024-06-08T05:59:22Z”,“timestamp”:171782362728},“reference count”:44,“publisher”:“MDPI AG”,“issue”:“11”,“license”:[{“start”:{“date parts”:[[2023,5,24]],“date time”:“2023-05-24T00:00:00Z”,“timestamp”:16848886400000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“https:\/\/creativecommons.org\/licenses\/by\/4.0\/”}],“内容域”:{“域”:[],“crossmark-restriction”:false},“short-container-title”:[“传感器”],“抽象”:“系统日志是系统可维护性的重要组成部分,因为它们记录了系统的状态和必要的故障排除和维护事件。因此,系统日志的异常检测至关重要。最近的研究重点是从非结构化日志消息中提取语义信息,用于日志异常检测任务。由于BERT模型在自然语言处理中工作良好,本文提出了一种称为CLDTLog的方法,该方法在BERT预处理模型中引入对比学习和双目标任务,并通过一个完全连接的层对系统日志执行异常检测。这种方法不需要日志解析,因此可以避免日志解析带来的不确定性。我们在两个日志数据集(HDFS和BGL)上训练了CLDTLog模型,在HDFS和BDL数据集上分别获得了0.9971和0.9999的F1分数,这比所有已知方法都要好。此外,当仅使用BGL数据集的1%作为训练数据时,CLDTLog仍然获得0.9993的F1分数,显示出优异的泛化性能,同时显著降低了训练成本<\/jats:p>“,”DOI“:”10.3390\/s23115042“,”type“:”journal-article“,”created“:{”date-parts“:[[2023,5,25]],”date-time“:”2023-05-25T06:30:06Z“,”timestamp“:1684996206000},”page“:“5042”,“source”:“Crossref”,“is-referenced-by-count”:2,“title”:[“CLDTLog:基于对比学习和双目标任务的系统日志异常检测方法”],“前缀”:“”10.3390“,“卷”:“23”,“作者”:[{“ORCID”:“http://\/ORCID.org\/0009-0004-2407-5303”,“authenticated-ORCID”:false,“给定”:“高奇”,“家庭”:“田”,“序列”:“第一”,“从属关系”:[}“名称”:“新疆大学软件学院,乌鲁木齐830046”}]},{“给定”:“努尔博尔”,“家族”:“卢克塔尔汗”,“顺序”:“附加”,“附属关系”:[{“名称”:“新疆大学信息科学与工程学院,乌鲁木齐830046Shi“,”sequence“:”additional“,”affiliation“:[{”name“:”新疆大学信息科学与工程学院,乌鲁木齐830046,中国“}]}],”member“:”1968“,”published-on-line“:{”date-parts“:[[2023,5,24]]},”reference“:[[{“key”:“ref_1”,“doi-asserted-by”:“crossref”,”unstructured“:”Bauer,E.,and Adams,R.(2012)《云计算的可靠性和可用性》,John Wiley&Sons著。“,”DOI“:”10.1002\/97811183994“},{”key“:”ref_2“,”DOI-asserted-by“:”crossref“,”unstructured“:”Le,V.H.,and Zhang,H.(2021201319年1月15日\u201319).无日志解析的基于日志的异常检测.澳大利亚墨尔本2021年IEEE\/ACM第36届自动化软件工程国际会议论文集.“,”10.1109\/ASE51524.2021.9678773“},{“key”:“ref_3”,“doi-asserted-by”:“crossref”,”unstructured“:“Kazemzadeh,R.S.,and Jacobsen,H.A.(2009年1月27日\u201330)。可靠且高可用的分布式发布/订阅服务。2009年第28届IEEE可靠分布式系统国际研讨会论文集,美国纽约州尼亚加拉瀑布市。”DOI“:”10.1109\/SRDS.2009.32“},{“key”:“ref_4”,“DOI-asserted-by”:“crossref”,“unstructured”:“Shinde,P.P.和Shah,S.(2018年1月16日\u201318)。机器学习和深度学习应用综述。2018年第四届国际计算通信控制与自动化会议论文集,印度浦那。”,“DOI”:“10.1109\/ICCUBEA.2018.8697857“},{“key”:“ref_5”,“unstructured”:“Lou,J.G.,Fu,Q.,Yang,S.,Xu,Y.,and Li,J.(2010年1月23日\u201325).从控制台日志中挖掘不变量以检测系统问题。USENIX年度技术会议记录,美国马萨诸塞州波士顿”}10.1109\/TDSC.2017.2762673“,”article-title“:“面向大规模日志数据分析的自动化日志解析”,“volume”:“15”,“author”:“He”,“year”:“2017”,“journal-title”:“IEEE Trans。可靠的安全。计算。“},{”key“:”ref_7“,”doi-asserted-by“:”crossref“,”unstructured“:”Liang,Y.,Zhang,Y.、Xiong,H.和Sahoo,R.(2007年1月28日\u201330)。ibm bluegene\/l事件日志中的故障预测。第七届IEEE国际数据挖掘会议论文集(ICDM 2007),美国东北奥马哈。“doi”:“10.1109\/ICDM.2007.46”},”{“key”:“ref_8”,“doi-asserted-by“:”crossref“,”first page“:”120239“,”doi“:”10.1016\/j.conbuildmat.2020.10239“,”article-title“:”减少实验室工作量的热拌沥青动态模量预测的预培训深度学习“,”volume“:“265”,”author“:”Moussa“,”year“:”2020“,”journal-title”:“Constr。生成。马特。“},{”key“:”ref_9“,”doi-asserted-by“:”crossref“,”first-page“:”100“,”doi“:”10.1016\/j.neucom.2019.11.067“,”article-title“:”Deep-learning based software defect prediction“,“volume”:“385”,“author”:“Qiao”,“year”:“2020”,“journal-title”:“Neurocomputing”},“key”:”ref_10“,”doi-asserted-by“”:”crosdref“”,“first-page:”106514“,“doi”:“10.1016\/j.aap.2021.106514“,“article-title”:“使用深度学习对后置发动机碰撞调查进行基于方差的全局敏感性分析”,“volume”:“165”,“author”:“Moussa”,“year”:“2022”,“journal-title“:“Accid”。分析。上一页。“},{”key“:”ref_11“,”doi-asserted-by“:”crossref“,”unstructured“:”Du,M.,Li,F.,Zheng,G.,and Srikumar,V.(11月,1月30日)。Deeplog:通过深度学习从系统日志进行异常检测和诊断。2017年美国德克萨斯州达拉斯ACM SIGSAC计算机与通信安全会议论文集。“doi”:“10.1145\/3133956.3134015“},{“key”:“ref_12”,“doi-asserted-by”:“crossref”,“unstructured”:“Zhang,B.,Zhang and H.,Moscato,P.,and Zhang with A.(2020,January 21\u201324)。通过从日志挖掘数字工作流关系进行异常检测。2020年可靠分布式系统(SRDS)国际研讨会论文集,中国上海。”,“doi”:“10.1109\/SRDS51746.2020.00027“},{“key”:“ref_13”,“doi-asserted-by”:“crossref”,“first page”:”2064“,“doi”:“10.1109\/TNSM.2020.3034647”,“article-title”:“Hitanomative:系统日志中异常检测的层次变换器”,“volume”:《17》,“author”:“Huang”,《年份》:“2020”,“journal-title“:”IEEE Trans.Netw.Serv.Manag.“}参考_14“,”doi-asserted-by“:”crossref“,”unstructured“:”Lu,S.,Wei,X.,Li,Y.,and Wang,L.(2018年1月12日\u201315)。使用卷积神经网络检测大数据系统日志中的异常。2018 IEEE第16届可靠、自主和安全计算国际会议论文集,第16届普及智能和计算国际会议,第四届大数据智能与计算国际会议和网络科学与技术大会(DASC\/PiCom\/DataCom\/CyberSciTech),希腊雅典。“,”DOI“:”10.1109\/DASC\/PiCom\/DataCom\/CyberSciTec.201.80037“},{”key“:”ref_15“,”DOI断言“:”crossref“,”非结构化“:”Zhang,X.,Xu,Y.,Lin,Q.,Qiao,B.,Zhang,H.,Dang,Y.,Xie,C.,Yang,X.,Cheng,Q.,and Li,Z.(2019年1月23日\u201328).对不稳定的日志数据进行稳健的基于日志的异常检测。2019年第27届ACM欧洲软件工程会议暨软件工程基础研讨会会议记录,希腊雅典。“,”DOI“:”10.1145\/3338906.3338931“},{”key“:”ref_16“,”DOI-asserted-by“:”crossref“,”unstructured“:”Meng,W.,Liu,Y.,Zhu,Y对数异常:非结构化日志中顺序和数量异常的无监督检测。IJCAI会议记录,中国澳门。“,”DOI“:”10.24963\/ijcai.2019\/658“},{”key“:”ref_17“,”unstructured“:”Devlin,J.,Chang,M.W.,Lee,K.,and Toutanova,K.(2018).Bert:语言理解深度双向变换器的预训练.arXiv.“}日志解析及其在日志挖掘中的应用的评估研究。2016年第46届IEEE\/IFIP可靠系统和网络国际会议(DSN)会议记录,法国图卢兹。“,”DOI“:”10.1109\/DSN.2016.66“},{”key“:”ref_19“,”DOI-asserted-by“:”crossref“,”unstructured“:”Zhu,J.、He,S.、Liu,J.,He,P.、Xie,Q.、Zheng和Lyu,M.R.(2019年1月25日\u201331)。用于自动日志分析的工具和基准。2019 IEEE\/ACM第41届软件工程国际会议论文集:软件工程实践(ICSE-SEIP),加拿大魁北克省蒙特利尔。“,”DOI“:”10.1109\/ICSE-SEIP.2019.00021“},{”key“:”ref_20“,”DOI-asserted-by“:”crossref“,”unstructured“:”Nedelkoski,S.,Bogatinovski,J.,Acker,A.,Cardoso,J.和Kao,O.(2020年1月14日\u201318)。自我监督日志分析。数据库中的机器学习和知识发现:应用数据科学轨道:欧洲会议,ECML PKDD 2020,比利时根特。会议记录,第四部分“,”DOI“:”10.1007\/978-3-030-67667-4_8“},{“key”:“ref_21”,“DOI-asserted-by”:“crossref”,“unstructured”:“He,P.,Zu,J.,Z.,and Lyu,M.R.(2017,January 25\u201330)。Drain:一种具有固定深度树的在线日志解析方法。2017 IEEE Web服务国际会议记录(ICWS)“,美国夏威夷州火奴鲁鲁”,“DOI”:“10.1109\/ICWS.2017.13”},{“key”:“ref_22”,“unstructured”:“Makanju,A.A.,Zincir-Heywood,A.N.,and Milios,E.E.(7月,1月28日)。使用迭代分区的聚类事件日志。第十五届ACM SIGKDD国际知识发现和数据挖掘会议论文集,法国巴黎。”}doi-asserted-by“:”crossref“,”unstructured“:”Jiang,Z.M.,Hassan,A.E.,Flora,P.,and Hamann,G.(2008年1月12日\u201313)。将执行日志抽象为企业应用程序的执行事件(短文)。《2008年第八届国际质量软件会议论文集》,英国牛津,“DOI”:“10.1109\/QSIC.2008.50”},{“key”:“ref_24”,“DOI-asserted-by”:“crossref”,“unstructured”:“Du,M.,and Li,F.(2016年1月12日\u201315)拼写:系统事件日志的流式分析。2016年IEEE第16届数据挖掘国际会议(ICDM)会议记录,西班牙巴塞罗那。“,”DOI“:”10.1109\/ICDM.2016.0103“},{“key”:“ref_25”,“unstructured”:“Joulin,A.,Grave,E.,Bojanowski,P.,Douze,M.,J\u00e9gou,H.,and Mikolov,T.(2016)。Fasttext.zip:压缩文本分类模型。arXiv.”},“key“:”ref_26“,”DOI-asserted-by“:”crossref“,”非结构化“:”Wang,Q.,Z.,Zhang,X.,and Cao,Z.(202 1)基于对比对抗训练和双特征提取的测井序列异常检测方法。熵,24.“,“DOI”:“10.3390\/e24010069”},{“key”:“ref_27”,“DOI-asserted-by”:“crossref”,“unstructured”:“Li,X.,Chen,P.,Jing,L.,He,Z.,and Yu,G.(2020,January 12\u201315)。Swisslog:针对各种故障的健壮且统一的基于深度学习的日志异常检测。2020年IEEE第31届软件可靠性工程国际研讨会(ISSRE)会议记录,葡萄牙科英布拉。“,”DOI“:”10.1109\/ISSRE5003.2020.00018“},{”key“:”ref_28“,”unstructured“:”Zhang,S.,Meng,W.,Bu,J.,Yang,S.、Liu,Y.、Pei,D.、Xu,J.、Chen,Y.,Dong,H.和Qu,X.(2017年1月14日\u201316)数据中心网络中用于交换机故障诊断和预测的系统日志处理。2017年IEEE\/ACM第25届国际服务质量研讨会会议记录,西班牙维拉诺瓦。“},{”key“:”ref_29“,”unstructured“:”Le,Q.,and Mikolov,T.(2014年1月21日\u201326)。句子和文档的分布式表示。机器学习国际会议论文集,PMLR,北京,中国。“}”,{“key”:“ref_30”,“doi-asserted-by”:“crossref”,“unstructure”:“”Meng,W.、Liu,Y.、Huang,Y.,Zhang,S.、Zaiter,F.、Chen,B.和Pei,D.(2020年,2013年1月3日)。在线日志分析的语义感知表示框架。2020年第29届计算机通信与网络国际会议(ICCCN)会议记录,美国俄亥俄州火奴鲁鲁”,“DOI”:“10.1109”,{“key”:“ref_31”,“unstructured”:“Sasaki,S.,Suzuki,J.,and Inui,K.(2019,January 2\u20137).基于子词的词嵌入紧凑重建。计算语言学协会北美分会2019年会议记录:人类语言技术,第1卷(长篇和短篇论文),明尼阿波利斯,明尼苏达州。“},{“key”:“ref_32”,“doi-asserted-by”:“crossref”,“unstructured”:“Lin,T.Y.、Goyal,P.、Girshick,R.、He,K.和Doll\u00e1r,P.(2017年1月22日\u201329)。密集目标检测的焦点丢失。IEEE国际计算机视觉会议论文集,意大利威尼斯。“,”DOI“:”10.1109\/ICCV.2017.324“},{”key“:”ref_33“,”DOI断言者“:”crossref“,”首页“:”107004“,”DOI“:”10.1016\/j.com.pag.2022.1007004“,”文章标题“:”基于插值图像的无监督对抗性领域自适应,用于水产养殖中的鱼类检测“,”卷“:”198“,”作者“:”赵“,”年份“:”2022“,”期刊标题“:”计算。电子。农业。“},{”key“:”ref_34“,”doi-asserted-by“:”crossref“,”unstructured“:”Wu,T.,Huang,Q.,Liu,Z.,Wang,Y.,and Lin,D.(2020年1月23日\u201328).长尾数据集中多标签分类的分布平衡损失.计算机视觉学报\u2014ECCV 2020:第16届欧洲会议,英国格拉斯哥.论文集,第IV部分16.“,“doi”:“10.1007\/978-3-030-58548-8_10“},{“key”:“ref_35”,“doi-asserted-by”:“crossref”,“unstructured”:“Mulyanto,M.,Faisal,M.、Prakosa,S.W.和Leu,J.S.(2020)。网络入侵检测系统中少数分类的焦点丢失有效性。对称,13.”,《doi》:“10.3390\/sym13010004”}Hermans,A.、Beyer,L.和Leibe,B.(2017年)。为重新确认身份的三胞胎损失辩护。arXiv公司。“},{”key“:”ref_37“,”doi-asserted-by“:”crossref“,”unstructured“:”Dong,X.,and Shen,J.(2018年1月8日\u201314)。用于对象跟踪的暹罗网络中的三重态损失。《欧洲计算机视觉会议论文集》,德国慕尼黑。“,”doi“:”10.1007\/978-3030-01261-8_28“}”,{非结构化“:”Schroff,F.、Kalenichenko,D.和Philbin,J.(2015年1月7日\u201312)。Facenet:人脸识别和聚类的统一嵌入。《IEEE计算机视觉和模式识别会议论文集》,美国马萨诸塞州波士顿。“,DOI”:“10.1109\/CVPR.2015.7298682”},{“key”:“ref_39”,“DOI asserted by”:“crossref”,“first page”:“259”,“DOI”:“10.1162\/tacl_A_00097”,“文章标题”:“Abcnn:用于句子对建模的基于注意的卷积神经网络“,”volume“:”4“,”author“:”Yin“,”year“:”2016“,”journal-title“:”Trans。关联计算。语言学家。},{“key”:“ref_40”,“unstructured”:“Wu,Y.,Schuster,M.,Chen,Z.,Le,Q.V.,NorouziVaswani,A.、Shazeer,N.、Parmar,N.,Uszkoreit,J.、Jones,L.、Gomez,A.N.、Kaiser,\u0141。和Polosukhin,I.(2017年1月4日\u20139)。注意力是你所需要的。第31届神经信息处理系统年会论文集,美国加利福尼亚州长滩。”},{“key”:“ref_42”,“doi-asserted-by”:“crossref”,“unstructured”:“Xu,W.,Huang,L.,Fox,A.,Patterson,D.,and Jordan,M.I.(2009年1月11日\u201314)。通过挖掘控制台日志来检测大规模系统问题。ACM SIGOPS第22届操作系统原理研讨会论文集,美国MT,Big Sky非结构化“:”Oliner,A.和Stearley,J.(2007年1月25日\u201328)。超级计算机所说:对五个系统日志的研究。第37届IEEE\/IFIP可靠系统和网络国际年会论文集(DSN\u201907),英国爱丁堡。“,”DOI“:”10.1109\/DSN.2007.103“}],”container-title“:[”Sensors“],”original-title”:[],”language“:”en“,”link“:[{”URL“:”https:\/\/www.mdpi.com\/1424-8220\/23\/11\/5042\/pdf“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,5,25]],”date-time“:”2023-05-25T07:05:23Z“,”timestamp“:1684998323000},”score“:1,”resource“:”primary“:parts“:[[2023,5,24]]},”references-count“:44,”新闻发布“:{”问题“:“11”,“在线发布”:{“日期部分”:[[2023,6]]}},“替代id”:[“s23115042”],“URL”:“http://\/dx.doi.org\/10.3390\/s23115042”,“关系”:{},”ISSN“:[”1424-8220“],“ISSN-type”:[{“值”:“1424-82200”,“类型”:“电子”}],“主题”:[],“发布”:{“日期部分”:[[2023,5,24]]}}