×

二元张量的降维和地形映射。 (英语) Zbl 1328.92037号

摘要:本文提出了一种二元张量的分解方法,即广义多线性主成分分析模型(GMLPCA)。据我们所知,目前还没有其他原理性的系统框架用于二元张量的分解或地形映射。在模型公式中,我们将每个张量元素的伯努利分布的自然参数约束在由一组简化的基(主)张量跨越的子空间中。我们在两种情况下评估并比较了所提出的GMLPCA技术和现有的实值张量分解方法:(1)在一系列涉及合成数据的受控实验中;(2) 在不同功能区域的DNA子序列的真实生物数据集上,序列由二进制张量表示。实验表明,与实值张量相比,GMLPCA模型更适合建模二元张量。此外,我们将GMLPCA模型扩展到半监督环境,迫使模型搜索一个自然参数子空间,该子空间表示建模质量和类分离程度之间的用户特定折衷。

MSC公司:

92 C55 生物医学成像和信号处理
68T05型 人工智能中的学习和自适应系统
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Lu H,Plataniotis KN,Venetsanopoulos AN(2008)MPCA:张量对象的多线性主成分分析。IEEE Trans神经网络19:18-39·doi:10.1109/TNN.2007.901277
[2] Nolker C,Ritter H(2002)连续手势的视觉识别。IEEE Trans神经网络13:983-994·doi:10.1109/TNN.2002.1021898号
[3] Jia K,Gong S(2005)用于同时超分辨率和识别的多模态张量面。In:第十届IEEE国际会议计算机视觉2:1683-1690(北京)
[4] Renard N,Bournnane S(2008)基于ICA的多线性代数工具,用于高光谱图像中的降维。IEEE国际会议声学、语音和信号处理,第4卷。内华达州拉斯维加斯,第1345-1348页
[5] Cai D,He X,Han J(2006)用于文档分析的张量空间模型。收录:第29届ACM SIGIR国际信息检索研究与开发年会论文集。西雅图,华盛顿州,第625-626页
[6] Pearson K(1901)关于与空间中的点系统最接近的线和平面。菲洛斯·马格2(6):559-572·doi:10.1080/14786440109462720
[7] Lu H,Plataniotis KN,Venetsanopoulos AN(2009)张量物体识别的正则化和聚合不相关多线性判别分析。IEEE Trans神经网络20:103-123·doi:10.1109/TNN.2008.2004625
[8] Zafeiriou S(2009)判别非负张量因式分解算法。IEEE Trans神经网络20:217-235·doi:10.1109/TNN.2008.2005293
[9] Panagakis Y,Kotropoulos C,Arce G(2010)《音乐体裁分类中听觉时间调制的非负多线性主成分分析》。IEEE Trans Audio Speech Lang过程18:576-588·doi:10.1109/TASL.2009.2036813
[10] Brachat J,Comon P,Mourrain B,Tsigaridas E(2010)对称张量分解。线性代数应用(出版,修正证明)·Zbl 1206.65141号
[11] Schein A,Saul L,Ungar L(2003)二进制数据主成分分析的广义线性模型。参加:第九届人工智能与统计国际研讨会。佛罗里达州基韦斯特
[12] Acar E,Yener B(2009),“无监督的多路数据分析:文献调查”,IEEE Trans Knowl data En 21:6-20·doi:10.1109/TKDE.2008.112
[13] Wang H,Ahuja N(2005)张量的秩r近似:使用图像矩阵表示。计算可视图形识别346-353
[14] De Lathauwer L,De Moor B,Vandewalle J(2000)多线性奇异值分解。SIAM J矩阵分析应用21(4):1253-1278·Zbl 0962.15005号 ·doi:10.1137/S0895479896305696
[15] Kofidis E,Regalia PA(2001)关于高阶超对称张量的最佳秩-1近似。SIAM J矩阵分析应用23(3):863-884·Zbl 1001.65035号 ·doi:10.1137/S0895479801387413
[16] Wang H,Ahuja N(2004)使用张量秩一分解的多维数据的紧凑表示。摘自:第17届国际会议论文集模式识别。英国剑桥,第44-47页·Zbl 1210.68083号
[17] Ye J,Janardan R,Li Q(2004)Gpca:一种有效的图像压缩和检索降维方案。摘自:2004年第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国纽约州纽约市,第354-363页,ACM,2004年。
[18] Xu D,Yan S,Zhang L,Lin S,Zhang H-J,Huang T(2008)用并行子空间分析重建和识别基于张量的对象。IEEE传输电路系统视频技术18:36-47·doi:10.1109/TCSVT.2007.903317
[19] Lu H,Plataniotis KN,Venetsanopoulos AN(2009)无监督多线性子空间学习的不相关多线性主成分分析。IEEE Trans Neural Netw 20(11):1820-1836·doi:10.1109/TNN.2009.2031144
[20] Inoue K,Hara K,Urahama K(2009)稳健多线性主成分分析。2009年10月2日至29日,第12届计算机视觉国际会议,第591-597页
[21] Lu H,Plataniotis KN,Venetsanopoulos AN(2011)张量数据的多线性子空间学习研究。图案识别44:1540-1551·Zbl 1210.68083号 ·doi:10.1016/j.patcog.2011.01.004
[22] Cortes C,Mohri M(2003)AUC优化与错误率最小化。内容:神经信息处理系统进展,第16卷。加拿大亚利桑那州班夫,第313-320页
[23] Li X,Zeng J,Yan H(2008)PCA-HPR:人类启动子识别的主成分分析模型。生物信息2(9):373-378·doi:10.6026/97320630002373
[24] Sonnenburg S,Zien A,Philips P,Ratsch G(2008)POIMs:位置低聚物重要性矩阵-理解基于支持向量机的信号检测器。生物信息学24(13):i6-i14·doi:10.1093/bioinformatics/btn170
[25] Baldi P,Brunak S(2001)《生物信息学:机器学习方法》。麻省理工学院出版社,第二版·Zbl 0992.92024号
[26] Isaev A(2007)《生物信息学数学方法导论》。斯普林格,塞考克斯·Zbl 1053.92022号
[27] Wakaguri H,Yamashita R,Sugano SYS,Nakai K(2008)DBTSS:转录起始位点数据库。核酸研究36:97-101(编号:数据库-期刊)
[28] Saxonov S、Daizadeh I、Fedorov A、Gilbert W(2000)《EID:外显子-内显子数据库——蛋白质编码内含子基因的详尽数据库》。核酸研究28(1):185-190·doi:10.1093/nar/28.1185
[29] Ron D,Singer Y,Tishby N(1996),“健忘症的力量:学习记忆长度可变的概率自动机。马赫学习25(2-3):117-149·Zbl 0869.68066号 ·doi:10.1007/BF00114008
[30] Tino P,Dorffner G(2001)从过去的分形表示预测离散序列的未来。马赫学习45(2):187-217·Zbl 1020.68075号 ·doi:10.1023/A:1010972803901
[31] Cross S,Clark V,Bird A(1999)从大基因组克隆中分离CpG岛。核酸研究27(10):2099-2107·doi:10.1093/nar/27.10.2099
[32] Bodén M,Bailey TL(2007)将转录因子结合位点基序与靶GO术语和靶基因结合。核酸研究36(12):4108-4117·数字对象标识代码:10.1093/nar/gkn374
[33] Ashburner M、Ball CA、Blake JA、Botstein D、Butler H、Cherry JM、Davis AP、Dolinski K、Dwight SS、Eppig JT、Harris MA、Hill DP、Issel-Tarver L、Kasarskis A、Lewis S、Matese JC、Richardson JE、Ringwald M、Rubin GM、Sherlock G(2000)《基因本体论:生物学统一的工具》。基因本体联盟。《自然遗传学》25(1):25-29·doi:10.1038/75556
[34] Straussman R、Nejman D、Roberts D、Steinfeld I、Blum B、Benvenisty N、Simon I、Yakhini Z、Cedar H(2009)人类基因组中CpG岛甲基化谱的发展规划。自然结构分子生物学16(5):564-571·doi:10.1038/nsmb.1594
[35] Bailey TL、Boden M、Buske FA、Frith M、Grant CE、Clementi L、Ren J、Li WW、Noble WS(2009)Meme suite:主题发现和搜索工具。核酸研究37:W202-W208(Web服务器问题)
[36] Gupta S、Stamatoyannopoulos J、Bailey T、Noble W(2007)《量化图案之间的相似性》。基因组生物学8(2):R24
[37] Globerson A,Roweis S(2006年),通过班级崩塌来衡量学习。Adva神经信息处理系统18:451-458
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。