×

可解释的基于图形的可信机器学习研究映射。 (英语) Zbl 07619851号

Teixeira、Andrea Sofia(编辑)等,《复杂网络XII》。2021年5月24日至26日,CompleNet 2021年第12届复杂网络会议记录。查姆:斯普林格。Springer程序。复杂。,73-85 (2021).
摘要:人们对确保机器学习(ML)框架以对社会负责的方式运行并被视为可信的越来越感兴趣。尽管最近在值得信赖的洗钱(TwML)领域取得了相当大的进展,但目前对这一进展的描述大多是定性的。因此,关于如何解决可信度问题和未来研究目标的决定往往留给感兴趣的研究人员。在本文中,我们提出了第一种定量方法来表征对TwML研究的理解。我们使用一个由7000多篇经同行评审的近期ML论文组成的网络语料库,构建了一个词汇共现网络,这些论文包括与TwML相关和无关的论文。我们使用社区检测来获取该网络中的词汇语义簇,从而推断TwML主题的相对位置。我们提出了一种创新的指纹算法,以获取单个单词的概率相似性分数,然后将它们结合起来,得出论文级的相关性分数。我们的分析结果为推进TwML研究领域提供了许多有趣的见解。
关于整个系列,请参见[Zbl 1481.91005号].

MSC公司:

68泰克 人工智能
05Cxx号 图论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Blondel,V.D.等人:大型网络中社区的快速发展。《统计力学杂志》。理论实验2008(10),P10008(2008)·Zbl 1459.91130号 ·doi:10.1088/1742-5468/2008/10/P10008
[2] Buscaldi,D.等人:挖掘学术数据以构建细粒度知识图。CEUR研讨会程序。2377, 21-30 (2019)
[3] Cheng,L.等人:《对社会负责的人工智能算法:问题、目的和挑战》(2021年)。arXiv:2101.02032
[4] Chinazzi,M.,Gonçalves,B.,Zhang,Q.,Vespignani,A.:绘制物理研究空间:机器学习方法。EPJ数据科学。8(1), 1-18 (2019). https://doi.org/10.1140/epjds/s13688-019-0210-z ·doi:10.1140/epjds/s13688-019-0210-z
[5] Chouldechova,A.,Roth,A.:机器学习中公平前沿的快照。Commun公司。ACM 63、82-89(2020年)·数字对象标识代码:10.1145/3376898
[6] Cimini,G.、Zaccaria,A.、Gabrielli,A.:调查国家研究体系基础之间的相互作用:绩效、投资和国际合作。J.Informetr公司。10(1), 200-211 (2016) ·doi:10.1016/j.joi.2016.01.002
[7] Fortunato,S.等人:《科学》。科学359(6379),eaao0185(2018)·doi:10.1126/science.aao0185
[8] García,J.,Fernández,F.:关于安全强化学习的综合调查。J.马赫。学习。第16(42)号决议,1437-1480(2015)·Zbl 1351.68209号
[9] Gong,M.等人:关于不同私有机器学习的调查[评论文章]。IEEE计算。智力。Mag.15(2),49-64(2020)·doi:10.1109/MCI.2020.2976185
[10] Helwegen,R.等人:在因果模型中使用变分推理改进公平预测。arXiv:2008.10880(2020)
[11] Kearns,M.,Roth,A.:道德算法:具有社会意识的算法设计科学。牛津大学出版社,牛津(2019)
[12] Krasanakis,E.等人:在个性化偏见下对图节点等级应用公平约束。收录于:《复杂网络及其应用九》,第944卷,第610-622页。施普林格国际出版社,商会(2021)。https://doi.org/10.1007/978-3-030-65351-4_49 ·doi:10.1007/978-3-030-65351-449
[13] Li,T.等:生物信息学文献中高频词的共现网络:结构特征和进化。申请。科学。8(10), 1994 (2018) ·doi:10.3390/app8101994年
[14] Madras,D.等人:通过因果意识实现公平:学习有偏见数据的因果潜在变量模型。收录于:FAT-2019,第349-358页(2019)
[15] Manning,C.D.,Schütze,H.:《统计自然语言处理基础》,第1版。麻省理工学院出版社,剑桥(1999)·Zbl 0951.68158号
[16] Mehrabi,N.等人:机器学习中的偏见和公平调查(2019年)。arXiv:1908.09635
[17] Mills,S.等人:《弥合负责任的人工智能差距的六个步骤》(2020年)。https://www.bcg.com/publications/2020/six-steps-for-socialy-responsible-artificial-intelligence网站
[18] Osting,B.等人:通过有针对性的数据收集增强统计排名。收录于:ICML-2013,第489-497页(2013)
[19] Palmucci,A.等人:你的领域在哪里?研究物理领域相对运动的机器学习方法。《公共科学图书馆·综合》15(6),e0233997(2020)·doi:10.1371/journal.pone.0233997
[20] Pathak,M.A.,Raj,B.:具有不同隐私的大边距多类高斯分类。在:Dimitrakakis,C.,Gkoulalas Divanis,A.,Mitrokotsa,A.,Verykios,V.S.,Saygin,Y.(编辑)数据挖掘和机器学习中的隐私和安全问题。PSDML 2010。计算机科学课堂讲稿,第99-112页。柏林施普林格(2011)。https://doi.org/10.1007/978-3-642-19896-0_9 ·Zbl 1326.68233号 ·doi:10.1007/978-3-642-19896-09
[21] Portenoy,J.等人:利用引文网络可视化学术影响力。前面。Res.Metr.公司。分析2、8(2017)·doi:10.3389/frma.2017.00008
[22] Radhakrishnan,S.等人:基于关键词共现网络的新方法,用于促进科学文献的系统评论。《公共科学图书馆·综合》12(9),e0185771(2017)·doi:10.1371/journal.pone.0185771
[23] Russell,J.,Santos,E.:解释马尔可夫决策过程中的奖励函数。2019年5月19日至22日,美国佛罗里达州萨拉索塔,第三十二届国际佛罗里达人工智能研究会会议记录。第56-61页(2019年)
[24] Sazonova,V.,Matwin,S.:结合二元分类器解决具有差分隐私的多类问题。事务处理。Data Priv.7,51-70(2014)
[25] Senekane,M.:使用支持向量机和差异隐私进行差异隐私图像分类。机器。学习。知识。外部。1(1), 483-491 (2019) ·doi:10.3390/make1010029
[26] Serna,I.等人:《敏感度损失:通过辨别软件深度学习提高面部表情的准确性和公平性》。arXiv:2004.11246(2020)
[27] Simáo,T.D.,Spaan,M.:在因子化环境中使用基线引导改进安全策略。收录于:AAAI-2019,第4967-4974页(2019)
[28] Steck,H.:校准建议。收录于:RecSys-2018,第154-162页(2018)
[29] Taccella,A.等人:基于关键词共现网络的新方法,用于促进科学文献的系统评论。《公共科学图书馆·综合》12(9),e0185771(2017)·doi:10.1371/journal.pone.0185771
[30] Toreini,E.等人:人工智能中的信任与可信的机器学习技术之间的关系。收录于:FAT-2020,第272-283页(2020年)
[31] Tullu,M.S.:撰写研究论文的标题和摘要:简洁、准确和细致是关键。沙特J.阿纳斯塔。13(补遗1),S12-S17(2019)·doi:10.4103/sja。SJA_685_18号
[32] Xiong,P.等人:《走向稳健可靠的机器学习系统开发》(2021年)。arXiv公司:2101.03042
[33] Yeganova,L.等人:通过文献分析了解新冠肺炎研究的前景:鸟瞰图(2020年)。arXiv:2008.03397号
[34] Zeng,A.等人:科学的科学:从复杂系统的角度来看。物理学。报告714-715、1-73(2017)·Zbl 1377.91146号 ·doi:10.1016/j.physrep.2017.1001
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。