插补 swMATH ID: 14376 软件作者: 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;博茨坦,D。;奥特曼,R。 描述: DNA微阵列缺失值估计。动机:基因表达微阵列实验可以生成多个缺失表达值的数据集。不幸的是,许多基因表达分析算法需要一个完整的基因数组值矩阵作为输入。例如,层次聚类和K-means聚类等方法对缺失数据不可靠,即使有少量缺失值,也可能会失效。因此,需要输入缺失数据的方法,以最小化不完整数据集对分析的影响,并增加这些算法可应用的数据集的范围。在本报告中,我们研究了估计缺失数据的自动化方法。结果:我们对基因微阵列数据中缺失值的几种估计方法进行了比较研究。我们实现并评估了三种方法:基于奇异值分解(SVD)的方法(SVDimpute)、加权K最近邻(KNNimpute)和行平均。我们使用各种参数设置和不同的实际数据集对这些方法进行了评估,并评估了插补方法对1-20范围内缺失数据量的稳健性 主页: http://bioinformatics.oxfordjournals.org/content/17/6/520.short 相关软件: R(右);softImpute软件;miss森林;VIM公司;老鼠;AS 136标准;UCI-毫升;阿梅利亚;玻璃制品;ElemStatLearn(电子状态学习);格尔姆奈特;风险评估;生物导体;MDA错误;插补;拜洛尔教育心理学;MissMech公司;巨大的;RegEM公司;Hmisc公司 引用于: 92出版物 全部的 前5名242位作者引用 三 彼得·菲兹莫瑟 三 拉胡尔·马祖姆德 三 克日什托夫·西蒙斯基 三 伊藤瓦西托 2 陈晓林 2 沙赫拉·费萨尔 2 希恩·松(Seuck Heun Song) 2 卡雷尔·赫隆 2 弗朗索瓦·胡森 2 朱莉·乔西 2 Lee,Jaewon先生 2 Lee,Jungbok先生 2 鲍里斯·米尔金。 2 米拉公园 2 特伦斯·保罗,速度 2 马提亚斯·坦普尔 2 Robert John Tibshirani先生 2 格哈德·图茨(Gerhard E.Tutz)。 2 卡琳·范登·布兰登 2 萨宾·韦尔本 2 杨爱军 1 阿查吉、密春 1 罗莎·阿格达姆 1 安德烈亚斯·阿尔芬斯 1 Allen,Genevera I。 1 安德烈斯·阿隆索。 1 保罗·阿诺尼 1 阿波斯托洛夫(Ognjan Apostolov) 1 马可·阿斯特 1 文森特·奥迪吉尔 1 穆罕默德·阿齐兹。 1 沃尔夫冈·巴斯克(Wolfgang E.Baaske)。 1 佛朗哥·巴格诺利 1 罗斯玛丽·A·贝利。 1 秃顶,大卫·约瑟夫 1 亚历山德罗·巴比埃罗 1 苏珊娜·巴博萨(Susana M.Barbosa)。 1 罗拉·巴胡米 1 阿菲夫·本·布拉欣 1 弗雷德里克·贝特朗 1 迪米特里斯·约翰·伯西马斯 1 苏普里塔姆·巴塔查吉 1 霍达·比德霍里 1 迈克尔·L·比特纳。 1 马西莫邦塞尼亚 1 彼得·伯尔曼 1 罗伯特·C·伯格哈特。 1 雷蒙德·詹姆斯·卡罗尔 1 马科斯·恩里克·卡斯科内 1 艾米丽·卡斯尔顿 1 蒂埃里·契库奥 1 陈春浩 1 陈立峰 1 陈松溪 1 陈,西安 1 陈晓静 1 陈毅A。 1 陈泽华 1 托马斯·切斯尼 1 Laura M.Chihara。 1 周嘉庆 1 香农·西卡雷洛 1 M.James C.克拉布。 1 库马尔·皮亚尔·达斯 1 达斯,斯瓦加坦 1 舒纳·达塔 1 阿奇亚·达克斯 1 弗朗西丝卡·迪·帕蒂 1 DiMaggio,Peter A.jun。 1 爱德华·多尔蒂。 1 杜志华 1 桑德琳·杜多特 1 埃斯拉奇,昌吉兹 1 克里斯托斯·法洛索斯 1 冯恩敏 1 法拉利、阿尔达码头 1 弗拉基米尔·菲尔科夫 1 弗洛达斯,克里斯托杜洛斯·阿奇利乌斯 1 安东尼诺·弗雷诺 1 罗伯特·M·弗伦德。 1 弗里德和简 1 施穆尔·弗里德兰 1 伊曼纽尔·弗伦托尼 1 傅韬扬 1 莫伊塔巴甘贾利 1 阿里·甘农 1 尤妮斯·坎皮兰·加西亚 1 唐纳德·戈德法布 1 彼得·古斯 1 索尼亚州Gouveia 1 保罗·格里加斯 1 顾,余 1 Harsha P.Gunawardena。 1 爱德华多·古铁雷斯-佩尼亚 1 史蒂文·吉吉(Steven P.Gygi)。 1 特雷弗·约翰·哈斯蒂 1 他,叶 1 克里斯蒂安·休曼 1 拉尔夫·迪特尔·希尔格斯 1 路易斯·库迪·霍塔 …还有142位作者 全部的 前5名53篇连载文章中引用 7 计算统计与数据分析 6 应用统计学年鉴 5 计算生物学和化学 三 美国统计协会杂志 三 机器学习 三 遗传学和分子生物学中的统计应用 三 电子统计杂志 2 统计数学研究所年鉴 2 计算与应用数学杂志 2 多元分析杂志 2 统计规划与推断杂志 2 计算统计学 2 统计传播。模拟和计算 2 模式识别 2 应用统计学杂志 2 机器学习研究杂志(JMLR) 2 数据分析和分类进展。ADAC公司 2 统计分析与数据挖掘 2 统计与计算 1 数学生物科学 1 模糊集与系统 1 信息科学 1 计算机与运筹学 1 神经网络 1 全球优化杂志 1 应用数学建模 1 统计传播。理论与方法 1 欧洲运筹学杂志 1 统计计算与模拟杂志 1 线性代数及应用 1 数学编程。A系列B系列 1 计算与决策科学基础 1 SIAM优化杂志 1 数学成像与视觉杂志 1 统计论文 1 工程中的数学问题 1 苯乙酸。模式分析与应用 1 数据挖掘与知识发现 1 国际应用数学与计算机科学杂志 1 商业和工业中应用的随机模型 1 定量金融学 1 REVSTAT公司 1 统计方法与应用 1 统计方法 1 信号、图像和视频处理 1 统计理论与实践杂志 1 SIAM成像科学杂志 1 数学地球科学 1 法国社会统计杂志 1 桑基拉。B系列 1 计算机科学评论 1 生物与健康统计 1 科学、工程和生物信息学 全部的 前5名在14个字段中引用 68 统计学(62-XX) 25 计算机科学(68至XX) 21 生物学和其他自然科学(92-XX) 10 数值分析(65-XX) 8 运筹学、数学规划(90-XX) 6 线性代数和多线性代数;矩阵理论(15-XX) 三 概率论与随机过程(60-XX) 2 博弈论、经济学、金融和其他社会和行为科学(91-XX) 2 系统论;控制(93至XX) 2 信息与通信理论、电路(94-XX) 1 组合数学(05-XX) 1 近似值和展开值(41至XX) 1 地球物理学(86-XX) 1 数学教育(97-XX) 按年份列出的引文