Dn2VEC

Dn2VEC:可变长度K-MeR的一致向量表示。长DNA序列的普遍表达之一是将其分为较短的K-MER组分。不幸的是,作为一个热矢量的K-MeR的简单矢量编码容易受到维数灾难的影响。更糟糕的是,任何一对热矢量之间的距离是等距的。当应用最新的机器学习算法来解决生物序列分析中的问题时,这是特别有问题的。在本文中,我们提出了一种新的方法来训练分布式表示的可变长度K-MeS。我们的方法是基于流行词嵌入模型Word2VEC,它是在浅层两层神经网络上训练的。我们的实验提供了证据表明,DN2VEC载体的总和类似于核苷酸级联。我们还证明了Needleman Wunsch相似性得分与DNa2VEC向量的余弦相似性之间存在相关性。

本软件关键词

这里的任何东西都将在支持画布元素的浏览器上被替换。


ZBMaCT中的参考文献(1篇文章中提到)

显示1的结果1。
按年份排序(引文

  1. Tillquist,Richard C.;LADELSER,Manuel E.:基因组序列的低维表示(2019)