×

FCA2VEC:用于形式概念分析的嵌入技术。 (英语) Zbl 1529.68279号

Missaoui,Rokia(编辑)等人,《具有正式概念分析的复杂数据分析》。查姆:斯普林格。47-74 (2022).
摘要:将大型高维数据嵌入到低维向量空间是计算处理当代数据集的必要任务。取代“潜在语义分析”的最新方法,如“word2vec”或“node2vec“,是这一领域中成熟的工具。在本论文中,我们引入了“fca2vec”,这是一系列用于形式概念分析(FCA)的嵌入技术。我们的调查有助于两个不同的研究方向。首先,我们支持将FCA概念应用于大型数据集。特别地,我们演示了如何从计算上可行的嵌入中检索概念格的覆盖关系。其次,我们对低维经典节点2vec方法进行了改进。对于两个方向,FCA对可解释结果的总体约束得以保留。我们通过计算不同数据集(如wiki44(Wikidata知识图的密集部分)、Mushroom数据集和源自FCA社区的发布网络)上的fca2vec来评估我们的新程序。
关于整个系列,请参见[Zbl 1491.68021号].

理学硕士:

68T09号 数据分析和大数据的计算方面
68立方英尺 知识表示
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adaricheva,K.V.,Nation,J.B.,Rand,R.:有限闭包系统的有序直接关联基础。离散应用数学161(6),707-723(2013)·Zbl 1288.06007号 ·doi:10.1016/j.dam.2012.08.031
[2] Aho,A.V.,Garey,M.R.,Ullman,J.D.:有向图的传递约简。SIAM计算机杂志1(2),131-137(1972)·兹比尔0247.05128 ·doi:10.1137/0201008
[3] Arthur,D.,Vassilvitskii,S.:k-means++:细心播种的优势。收录于:N.Bansal,K.Pruhs,C.Stein(编辑)《第十八届ACM-SIAM离散算法年度研讨会论文集》,SODA 2007,美国路易斯安那州新奥尔良,2007年1月7日至9日,第1027-1035页。SIAM(2007)·兹比尔1302.68273
[4] Belohlávek,R.,Trnecka,M.:布尔矩阵因式分解中的From-below近似:几何和新算法。J.计算。系统。科学。81(8), 1678-1697 (2015) ·Zbl 1328.68295号 ·doi:10.1016/j.jss.2015.06.002
[5] Belohlávek,R.,Vychodil,V.:通过矩阵分解的新方法发现二进制数据中的最佳因子。J.计算。系统。科学。76(1), 3-20 (2010) ·Zbl 1180.15026号 ·doi:10.1016/j.jcss.2009.05.002
[6] Bishop,C.M.:模式识别和机器学习。施普林格科学+商业媒体(2006)·Zbl 1107.68072号
[7] Caro-Contreras,D.E.,Mendez-Vazquez,A.:使用树状神经网络计算概念格。M.Ojeda-Aciego,J.Outrata(编辑),《第十届概念格及其应用国际会议论文集》,法国拉罗谢尔,2013年10月15-18日,CEUR研讨会记录第1062卷,第141-152页。CEUR-WS.org(2013)。统一资源定位地址http://ceur-ws.org/Vol-1062/paper12.pdf
[8] Codocedo,V.,Taramasco,C.,Astudillo,H.:在大的形式背景下进行形式概念分析的作弊。摘自:A.Napoli,V.Vychodil(编辑)《第八届概念格及其应用国际会议论文集》,法国南希,2011年10月17日至20日,CEUR研讨会记录第959卷,第349-362页。CEUR-WS.org(2011)
[9] Dua,D.,Graff,C.:UCI机器学习库(2017)。统一资源定位地址http://archive.ics.uci.edu/ml
[10] Ganguly,S.,Pudi,V.:论文2vec:结合图形和文本信息进行科学论文表示。摘自:J.M.Jose、C.Hauff、I.S.Altñngovde、D.Song、D.Albakour、S.Watt、J.Tait(编辑)《信息检索进展》,第383-395页。施普林格国际出版公司,Cham(2017)·数字对象标识代码:10.1007/978-3-319-56608-5_30
[11] Ganter,B.,Wille,R.:形式概念分析:数学基础。柏林施普林格-弗拉格出版社(1999年)·Zbl 0909.06001号 ·doi:10.1007/978-3-642-59830-2
[12] Goldberg,Y.,Levy,O.:word2vec解释道:推导Mikolov等人的负采样单词嵌入方法。CoRR abs/1402.3722(2014)
[13] Grover,A.,Leskovec,J.:node2vec:网络的可扩展特征学习。收录于:B.Krishnapuram、M.Shah、A.J.Smola、C.C.Aggarwal、D.Shen、R.Rastogi(编辑)《第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,2016年8月13日至17日,美国加利福尼亚州旧金山,第855-864页。ACM(2016)
[14] Hanika,T.,Hirth,J.:Conexp-clj-FCA的研究工具。在:D.Cristea,F.L.Ber,R.Missaoui,L.Kwuida,B.Sertkaya(编辑)ICFCA 2019年会议和研讨会补充会议记录,德国法兰克福,2019年6月25-28日,CEUR研讨会记录,第2378卷,第70-75页。CEUR-WS.org(2019年)
[15] Hanika,T.,Marx,M.,Stumme,G.:在维基数据中发现隐含知识。收录人:D.Cristea、F.L.Ber、B.Sertkaya(编辑)《形式概念分析——第十五届国际会议》,2019年6月25日至28日,2019,德国法兰克福,LNCS公司第11511卷,第315-323页。施普林格(2019)·Zbl 1529.68296号
[16] Ho,V.T.,Stepanova,D.,Gad Elrab,M.H.,Kharlamov,E.,Weikum,G.:嵌入模型指导下的知识图规则学习。收录人:D.Vrandecic、K.Bontcheva、M.C.Suárez-Figueroa、V.Presutti、I.Celino、M.Sabou、L.Kaffee、E.Simperl(编辑)《语义网络——2018年国际语义网络世界杯第17届国际语义网络会议》,2018年10月8日至12日,美国加利福尼亚州蒙特利,会议录,第一部分,LNCS公司第11136卷,第72-90页。施普林格(2018)
[17] Kuznetsov,S.O.,Makhazhanov,N.,Ushakov,M.:基于概念格的神经网络架构。作者:M.Kryszkiewicz、A.Appice、D.Slezak、H.Rybinski、A.Skowron、Z.W.Ras(eds.)《智能系统基础——第23届国际研讨会》,2017年6月26日至29日,波兰华沙,ISMIS 2017,会议记录,计算机科学课堂讲稿第10352卷,第653-663页。施普林格(2017)·Zbl 1461.68185号
[18] LeCun,Y.、Bengio,Y.和Hinton,G.:深度学习。《自然》521436(2015)·doi:10.1038/nature14539
[19] Mikolov,T.,Chen,K.,Corrado,G.,Dean,J.:向量空间中单词表示的有效估计。In:Y.Bengio,Y.LeCun(编辑)ICLR(车间海报)(2013)
[20] Mikolov,T.、Sutskever,I.、Chen,K.、Corrado,G.S.、Dean,J.:单词和短语的分布式表示及其组成。摘自:C.J.C.Burges,L.Bottou,Z.Ghahramani,K.Q.Weinberger(编辑)《神经信息处理系统进展》第26期:第27届2013年神经信息处理体系年会。2013年12月5日至8日在美国内华达州塔霍湖举行的会议记录,第3111-3119页(2013)
[21] Mnih,A.,Hinton,G.E.:一种可扩展的分层分布式语言模型。收录于:D.Koller、D.Schuurmans、Y.Bengio、L.Bottou(编辑)《神经信息处理系统进展》21,《第二十二届神经信息处理体系年会论文集》,加拿大不列颠哥伦比亚省温哥华,2008年12月8日至11日,第1081-1088页。Curran Associates,Inc.(2008年)
[22] 尼尔森,F.奥利:Wembedder:嵌入web服务的Wikidata实体。CoRR abs/1710.04099(2017)
[23] 佩德雷戈萨(Pedregosa,F.)、瓦罗奎斯(Varoqueux,G.)、格拉姆福特(Gramfort,A.)、米歇尔(Michel,V.)、提里昂(Thirion,B.)、格里塞尔(Grisel,O.)、布隆德尔(Blondel,M.)、普雷滕霍弗(Prettenhofer,P.)、韦斯(Weiss,R.)、杜堡(Dubourg,V.,Vanderplas,J.)、帕索斯(Passos,A.),库纳波(Cournap。机器学习研究杂志12,2825-2830(2011)·Zbl 1280.68189号
[24] Peng,H.,Li,J.,Song,Y.,Liu,Y.:增量学习神经语言模型的分层softmax函数。收录于:S.P.Singh,S.Markovitch(编辑)《第三十届AAAI人工智能会议论文集》,2017年2月4日至9日,美国加利福尼亚州旧金山,第3267-3273页。AAAI出版社(2017)
[25] Perozzi,B.,Al-Rfou,R.,Skiena,S.:深度行走:社会表征的在线学习。收录于:S.A.Macskassy,C.Perlich,J.Leskovec,W.Wang,R.Ghani(编辑)第20届ACM SIGKDD国际知识发现和数据挖掘会议,KDD’14,美国纽约州纽约市-2014年8月24日至27日,第701-710页。ACM(2014)
[26] Ristoski,P.,Rosati,J.,Noia,T.D.,Leone,R.D.,Paulheim,H.:Rdf2vec:RDF图嵌入及其应用。语义网10(4),721-752(2019)·电话:10.3233/SW-180317
[27] Rong,X.:word2vec参数学习解释。CoRR abs/1411.2738(2014)
[28] Rudolph,S.:使用FCA将闭包运算符编码到神经网络中。In:U.Priss,S.Polovina,R.Hill(编辑)《概念结构:智能应用的知识架构》,第15届概念结构国际会议,2007年ICCS,英国谢菲尔德,2007年7月22日至27日,会议记录,LNCS公司第4604卷,第321-332页。施普林格(2007)·Zbl 1213.68608号
[29] Schlimer,J.:蘑菇记录摘自澳大利亚蘑菇协会的北美蘑菇实地指南。GH Lincoff(Pres),纽约(1981)
[30] Scott,D.:测量结构和线性不等式。数学心理学杂志1(2),233-247(1964)·Zbl 0129.12102号 ·doi:10.1016/0022-2496(64)90002-1
[31] Vrandecic,D.,Krötzsch,M.:维基数据:一个免费的协作知识库。Commun公司。ACM 57(10),78-85(2014)·doi:10.1145/2629489
[32] Wang,Z.,Zhang,J.,Feng,J.、Chen,Z.:通过在超平面上平移来嵌入知识图。C.E.Brodley,P.Stone(编辑)《第二十届AAAI人工智能会议论文集》,2014年7月27日至31日,加拿大魁北克省魁北克市,第1112-1119页。AAAI出版社(2014)
[33] Wille,U.:实向量空间中有限序数数据的表示。摘自:H.H.Bock,W.Polasek(编辑)《数据分析和信息系统》,第228-240页。施普林格-柏林-海德堡,柏林,海德堡(1996)·Zbl 0896.62001号 ·doi:10.1007/978-3642-80098-6_20
[34] Wille,U.:综合几何在表征测量理论中的作用。《数学心理学杂志》41(1),71-78(1997)·Zbl 0921.92037号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。