摘要
A.Apostolico、O.Denas和A.Dress。 用于比较子串分析的有效工具。 生物技术杂志,149(3):120-62010年9月。 谷歌学者 交叉引用 D.布莱。 概率主题模型。 CACM,55(4):77-842012年11月。 谷歌学者 数字图书馆 D.M.Blei和M.I.Jordan。 建模带注释的数据。 SIGIR,第127-134页,美国纽约州纽约市,2003年。 ACM公司。 谷歌学者 数字图书馆 D.M.Blei和J.D.Lafferty。 使用多单词表达式可视化主题。 arXiv,2009年。 谷歌学者 M.加勒。 用最小语法问题搜索DNA中的紧凑层次结构。 雷恩大学1号,2011年2月。 谷歌学者 M.Galle和J.-M.Renders。 ECIR中Star-EM的新闻文章的完整和半批聚类。 施普林格,2012年。 谷歌学者 数字图书馆 D.古斯菲尔德。 字符串、树和序列的算法:计算机科学和计算生物学。 剑桥大学出版社,1997年1月。 谷歌学者 数字图书馆 H.Lodhi、C.Saunders、J.Shawe-Taylor、N.Cristianini和C.Watkins。 使用字符串内核的文本分类。 机器学习研究杂志,2:419-4442002。 谷歌学者 数字图书馆 T.Masada、A.Takasu、Y.Shibata和K.Oguri。具有最大子串的聚类文档。 在企业信息系统中,第102卷,第19-34页。 施普林格-柏林-海德堡,2012年。 谷歌学者 交叉引用 尼古拉斯、C.卢梭、A.西格尔、P.西格尔、F.科斯特、P.杜兰德、S.坦普尔、A.-S.瓦林和F.马赫。 在基因组序列上模拟局部重复。 技术报告,INRIA,2008年。 谷歌学者 D.Okanohara和J.-I.Tsujii。 具有所有子字符串功能的文本分类。 在SDM中,第838-846页,2009年。 谷歌学者 交叉引用 S.J.Puglishi、W.F.Smyth和M.Yusufu。 计算字符串中所有重复项的快速优化算法。PSC,第161-169页,2008年。 谷歌学者 C.van Rijsbergen,《信息检索》。 巴特沃斯,1979年。 谷歌学者 数字图书馆 H.M.Wallach先生。 主题建模:超越纸上谈兵。 在ICML中,第977-984页。 ACM,2006年。 谷歌学者 数字图书馆 X.Wang、A.McCallum和X.Wei。 主题N-Grams:短语和主题发现,及其在信息检索中的应用。 在ICDM中,第697-702页。 IEEE,2007年10月。 谷歌学者 数字图书馆 J.G.沃尔夫。 通过优化和分布分析学习语法和意义。 《语言习得的分类和过程》,1988年1月。 谷歌学者
建议
紧后缀向量和最大重复的在线构造 字符串的后缀向量是相当于后缀树的索引数据结构。 Monostori等人于2001年首次引入该方法[K.Monostori],《识别大型数字馆藏中重叠文档的高效计算方法》。。。