巴拉圭人 swMATH ID: 29731 软件作者: Kraj P、Sharma A、Garge N、Podolsky R、Richard A、Mcindoe RA 描述: ParaKMeans:适用于一般实验室使用的并行K-means算法的实现。背景:在过去十年中,使用微阵列评估许多生物系统的转录组产生了大量数据。组织和分析微阵列数据的常用技术是执行聚类分析。虽然已经开发了许多聚类算法,但随着所分析数据集的规模变得非常大,它们的计算性能都会显著下降。例如,在台式PC上对包含200个微阵列的实验中的10000个基因进行聚类可能会非常耗时且具有挑战性。集群算法可扩展性问题的一个解决方案是在多台计算机上分布或并行化该算法。结果:本文描述的软件是一个高性能的多线程应用程序,实现了K-means聚类算法的并行版本。大多数并行处理应用程序不可供公众访问,并且需要专门的软件库(例如MPI)和专门的硬件配置。应用程序的并行性来自于使用web服务来执行距离计算和集群分配。在这里,我们展示了我们的并行实现在使用七个节点的大量数据集上提供了显著的性能提升。该软件是用C#编写的,并以模块化的方式设计,以提供部署灵活性和用户界面的灵活性。结论:ParaKMeans旨在为普通科学界提供一个易于管理的客户端-服务器应用程序,可以安装在各种Windows操作系统上。 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2375128/ 相关软件: 群集查找;ImageNet公司;AlexNet公司;Hadoop公司;MapReduce;MAVisto公司;算法97;PAML公司;ACME公司;ClustalW公司;国防部;MultiPhyl公司;PathBLAST(路径BLAST);格雷姆林;卡沃什;NeMoFinder公司;基因智慧;MotifClick(鼠标点击);ParaMEME公司;普鲁斯塔尔 引用于: 3文件 全部的 前5名9位作者引用 1 卡罕·埃尔西耶斯 1 斯蒂芬·拉蒙·加西亚 1 戈兰,大卫 1 约翰·哈丁(Johanna S.Hardin)。 1 李艳涛 1 容卓波 1 王斌峰 1 夏,大文 1 张子丽 3篇连载文章中引用 1 自然与社会中的离散动力学 1 应用统计学年鉴 1 计算生物学 全部的 前5名在6个字段中引用 1 组合数学(05-XX) 1 线性代数和多线性代数;矩阵理论(15-XX) 1 统计学(62-XX) 1 计算机科学(68-XX) 1 运筹学、数学规划(90-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文