西梅克

R软件包SimSeq:RNA序列数据的非参数模拟。RNA测序分析方法通常依赖于假设的读取计数参数模型,而这些参数模型在实际应用中不太可能得到精确的满足。方法通常通过分析根据假设模型模拟的数据进行测试。这种测试策略可能导致对RNA序列分析方法的性能过于乐观。我们开发了一个基于数据的RNA序列数据模拟算法。为给定实验单元模拟的读取计数向量具有与用户提供的源RNA seq数据集的分布紧密匹配的联合分布。用户可以控制模拟差异表达(DE)的基因比例,并提供一个权重向量来控制效应大小的分布。该算法需要至少两个治疗组中具有大样本量的RNA序列读取计数矩阵。许多数据集都符合这个标准。

此软件的关键字

画布中支持的任何元素都将被替换