MSC 62H30中最近的zbMATH文章 https://zbmath.org/atom/cc/62H30 2024-04-15T15:10:58.286558Z Werkzeug公司 GT2-CFC:通用2类协同模糊聚类方法 https://zbmath.org/1530.62026 2024-04-15T15:10:58.286558Z “萨利希,法里巴” https://zbmath.org/authors/?q=ai:salehi.fariba “Keyvanpour,Mohammad Reza” https://zbmath.org/authors/?q=ai:keyvanpour.mohammadreza “谢里菲,阿拉什” https://zbmath.org/authors/?q=ai:sharifi.arash (无摘要) 基于OWA的典型度时间序列鲁棒模糊聚类 https://zbmath.org/1530.62027 2024-04-15T15:10:58.286558Z “迪尔索,皮耶保罗” https://zbmath.org/authors/?q=ai:durso.pierpaolo “Leski,Jacek M.” https://zbmath.org/authors/?q=ai:leski.jacek-米 摘要:在许多情况下,数据不是以时间轴上的单个值表示的,而是在特定时刻获得的值的集合——它们是时间序列。在这些情况下,一次性数据的传统聚类模型无法正确考虑数据的时间可变性。本文通过在模糊框架中考虑medoids方法的划分,提出了多元时间序列的模糊聚类模型。为了抵消离群时间序列在聚类过程中的负面影响,我们结合Huber的M估计量和Yager的OWA算子,提出了时间序列的鲁棒模糊c-中值聚类模型。所提出的模型能够通过所谓的典型性参数平滑异常时间序列的影响,能够调整异常值的影响。通过模拟和实际数据集研究,证明了所提出模型的性能:(i)时间序列的二维数据集,(ii)平均每日温度时间序列,以及(iii)时间序列中的妊娠数据集。与文献中已知的稳健聚类模型进行的比较表明,引入的模型与其他模型相比具有竞争力。 思考数据科学。数据科学从业者指南 https://zbmath.org/1530.68004 2024-04-15T15:10:58.286558Z “普纳昌德拉萨拉” https://zbmath.org/authors/?q=ai:sarang.poornachandra 本书的结构是对当前数据科学和适用于数据集的机器学习方法的系统概述。它分为20章,以框架(第1章)和建议(第20章)开始和结束,用于以计算稳健的方式处理大型数据集。第一章重点介绍数据准备、探索性分析和缩小适用于给定设置的模型列表等处理步骤。作者还介绍了一些概念,如参数调整或基于转移学习的模型,这些将在后续章节中进一步讨论。第二章致力于降维;讨论了线性、主成分分析和非线性方法、tSNE和UMAP。本章最后对奇异值分解和线性判别分析进行了评论。本书的其余部分分为三个部分,分别是监督学习(第一部分)、非监督学习(第二部分)和人工神经网络(第三部分)。第一部分包括回归分析(第3章)、决策树(第4章)和集成方法、打包和提升(第5章)、k近邻(第6章)、朴素贝叶斯(第7章)和支持向量机(第8章)五章。对于这些方法中的每一种,都通过实例介绍了理论;同时还讨论了参数优化方法的优点和缺点。还概述了各种各样的方法。第二部分重点介绍聚类算法。第9章讨论了基于质心的方法(k-means和k-medoids);基于连接的算法(第10章)包括凝聚和除法。在第11章中,作者重点讨论了高斯混合模型,详细介绍了概率分布的特征以及合适簇数的选择。最后,在第12章中,介绍了基于密度的方法;其中包括DBSCAN、OPTICS和均值漂移聚类。随后的四章概述了具体的框架(BIRCH,第13章;CLARA,第14章;亲和传播聚类,第15章;STING和CLIQUE,第16章),这些框架的理论细节与优缺点和适用性的详细讨论相平衡。第三部分包括两章,重点介绍人工神经网络。第17章是建立在各种风格的人工神经网络(感知机方法、卷积神经网络、生成性对抗网络、递归神经网络和长-短期记忆方法)的理论方面。第18章侧重于自然语言处理和基于图像的数据集的应用。本书最后总结了自动化工具(例如auto-sklearn、auto-keras和AutoML框架——都是基于Python的)。第20章是由11个工作流组成的备忘单,是进行更复杂分析的良好起点。大多数章节都是从所描述的概念的概要开始的;所有章节都以总结结束,再次强调了所讨论的基本方面。这本书的教学价值通过大量的示例和代码片段得以增强,这些示例和代码将理论概念与实际应用联系起来。这本书的风格为广大读者所接受,大多数必要的概念要么在书中讨论,要么被很好地引用。审查人:Irina Ioana Mohorianu(牛津) 用于降维和数据聚类的动态图学习 https://zbmath.org/1530.68005 2024-04-15T15:10:58.286558Z “朱磊” https://zbmath.org/authors/?q=ai:zhu.lei “李,晶晶” https://zbmath.org/authors/?q=ai:li.jingjing “张,郑” https://zbmath.org/authors/?q=ai:zhang.zheng.6|zhang.zhen.4|zhang.zheng|zhang.theng.7|zhang.gheng.8 出版商描述:本书阐述了如何实现有效的降维和数据聚类。作者解释了如何在大数据时代利用先进的动态图学习技术来实现这一点。本书首先介绍了动态图形学习的背景知识。作者讨论了为什么它近年来吸引了大量的研究关注,并成为公认的先进技术。在涵盖了与动态图形学习相关的关键主题之后,该书讨论了该领域的最新进展。然后,作者解释了这些技术如何实际应用于多种目的,包括特征选择、特征投影和数据聚类。 可逆细胞自动机:一种自然聚类技术 https://zbmath.org/1530.68184 2024-04-15T15:10:58.286558Z “穆克吉、苏坎亚” https://zbmath.org/authors/?q=ai:mukherjee.sukanya “巴塔查吉,卡马利卡” https://zbmath.org/authors/?q=ai:bhattacharjee.kamalika “达斯,苏坎塔” https://zbmath.org/authors/?q=ai:das.sukanta网址 摘要:这项工作提出了可逆有限元胞自动机(CA)作为一种自然聚类工具,其中两种配置之间的接近度是通过它们是否可以从彼此到达来衡量的。由于任何有限可逆CA都将其构型分布到多个循环空间中,因此,属于同一循环的两个构型彼此接近。利用这种行为,我们将可逆CA视为一种自然聚类技术,其中每个循环空间形成一个唯一的簇。为了使用这个特性,使用推测编码函数将实际数据对象映射到二进制字符串(CA的配置)。识别了一些属性以过滤执行有效聚类的候选细胞自动机(CA)。此外,还提出了一种迭代算法,以确保只形成所需数量的簇。最后,使用一些标准验证指标对我们算法在实际数据上的性能进行了测试。通过与现有的基准聚类算法进行比较,我们发现我们的算法至少可以与现有的最佳算法媲美。因此,如果选择得当,简单系统(如可逆CA)的局部性和互连性有可能在任何实际数据集中实现最佳聚类。 通过泊松分布加权路径长度的袋式通道模型的简单扩展 https://zbmath.org/1530.68199 2024-04-15T15:10:58.286558Z “Courtain,Sylvain” https://zbmath.org/authors/?q=ai:courtain.sylvain “马尔科·塞伦斯” https://zbmath.org/authors/?q=ai:saerens.marco 总结:这项工作通过引入泊松概率分布提供的网络中路径长度的权重,扩展了bag-of-path模型[\textit{K.Françoisse}et al.,Neural Netw.90,90-111(2017;Zbl 1434.68535)]。这种方法的主要优点是,它允许调整与手头应用程序最相关的平均路径长度参数。各种感兴趣的量,例如从路径包中提取路径的概率,或对连接两个感兴趣节点的任何路径进行采样的连接概率,都可以很容易地从该模型中以封闭形式计算出来。在这种情况下,考虑到路径长度的权重因子,定义了一种新的网络节点之间的距离度量。在半监督分类任务上的实验表明,与其他最先进的方法相比,引入的距离度量提供了具有竞争力的结果。此外,根据新模型,提出了对数传染性相似性度量[textit{V.Ivashkin}和\textit{P.Chebotarev},Springer Proc.Math.Stat.197,87-105(2017;Zbl 1380.05186)]的新解释。关于整个系列,请参见[Zbl 1492.94005]。 基于图连通性搜索的聚类新方法 https://zbmath.org/1530.68203 2024-04-15T15:10:58.286558Z “迈克尔·G·萨多夫斯基” https://zbmath.org/authors/?q=ai:sadovsky.michael-克 “布什梅勒夫,尤金·尤伊。” https://zbmath.org/authors/?q=ai:bushmelev.eugene-于 “奥斯蒂洛夫斯基,阿纳托利·N。” https://zbmath.org/authors/?q=ai:ostylovsky.anatoly-n个 小结:提出了一种识别数据集中簇的新方法。该方法基于对数据集中最长距离的连续消除,从而使相关图失去一些边。当图形断开连接时,该方法停止。 使用扩散接口方法和快速矩阵向量积的聚合多层图的半监督学习 https://zbmath.org/1530.68206 2024-04-15T15:10:58.286558Z “Kai Bergermann” https://zbmath.org/authors/?q=ai:bergermann.kai “斯托尔,马丁” https://zbmath.org/authors/?q=ai:stol.martin “Volkmer,托尼” https://zbmath.org/authors/?q=ai:volkmer.toni 摘要:我们将基于扩散界面方法的基于图的多类半监督分类技术推广到多层图。除了使用固有的多层结构处理各种应用程序之外,我们还提供了一种非常灵活的方法,可以在低维多层图表示中解释高维数据。高效的数值方法包括相应微分图算子的谱分解以及基于非等间距快速傅里叶变换的快速矩阵-向量乘积,能够快速处理大型高维数据集。我们进行了各种数值测试,特别关注图像分割。特别是,我们在每层多达1000万个节点以及多达104个维度的数据集上测试了我们的方法的性能,得到了最多52层的图形。虽然所有提出的数值实验都可以在普通笔记本电脑上运行,但在我们算法的所有阶段,运行时的每个迭代步长对网络大小的线性依赖性使得它可以扩展到更大和更高维的问题。 基于模糊ART和直觉模糊双支持向量机的班级不平衡学习 https://zbmath.org/1530.68219 2024-04-15T15:10:58.286558Z “萨利姆·雷兹瓦尼” https://zbmath.org/authors/?q=ai:rezvani.salim “王,西照” https://zbmath.org/authors/?q=ai:wang.sizhao (无摘要) 用于特征选择的连续数据中的自动颗粒发现 https://zbmath.org/1530.68220 2024-04-15T15:10:58.286558Z “Sewwandi,M.A.N.D.” https://zbmath.org/authors/?q=ai:sewwandi.m-a-n-d(a-n-d) “李岳峰” https://zbmath.org/authors/?q=ai:li.yuefeng “张静兰” https://zbmath.org/authors/?q=ai:zhang.jinglan (无摘要)