×

皮莱明斯

swMATH ID: 22398
软件作者: 阿米娜·阿西夫(Amina Asif)、瓦吉德·阿沙德·阿巴斯(Wajid Arshad Abbasi)、法泽恩·穆尼尔(Farzeen Munir)、阿萨·本·胡尔(Asa Ben-Hur)、法亚兹·乌尔·阿米尔·阿夫萨尔·米哈斯
描述: 皮莱明斯:生物信息学应用的大幅度多实例分类和排名。动机:计算生物学中基于机器学习的方法的发展面临的一个主要挑战是,由于实验性注释蛋白质和DNA序列属性所需的时间和资源,数据可能无法准确标记。标准的监督学习算法假设训练数据的实例级标记准确。多实例学习是处理此类标签歧义的一种范例。然而,用于多实例学习的广泛使用的大边缘分类方法本质上是启发式的,具有较高的计算要求。在本文中,我们提出了用于多实例分类和排序的随机次梯度优化大裕度算法,并在一个称为pyLEMMINGS的软件套件中提供了这些算法。结果:我们在许多生物信息学问题以及基准数据集上测试了pyLEMMINGS。pylemings已经成功地识别了蛋白质的重要功能片段:钙调素结合蛋白中的结合位点、朊病毒形成区和淀粉样核。pyLEMMINGS在所有这些任务中实现了最先进的性能,证明了多实例学习的价值。此外,与启发式解相比,我们的方法在运行时间方面提高了100倍以上,与基准数据集相比,启发式解的准确性得到了提高。可用性和实现:pyLEMMINGS python包可在以下网址下载:this http URL
主页: http://教员.pieas.edu.pk/fayyaz/software.html#pylemmings
关键词: 多实例学习;序列分析;蛋白质序列分析;普里昂斯;淀粉样蛋白;钙调蛋白;学习;arXiv公司。LG公司;机器学习;arXiv统计.ML;arXiv公司
相关软件: 财产;中国人民解放军司令部;帕伽索斯;阿根廷;MISVM公司;蟒蛇
引用于: 0个文档