动机:
大多数降维算法都假设输入数据是从流形中采样的$\mathcal{M}$其内在维度d美元$远小于环境尺寸D美元$在机器学习和应用数学界,这通常称为流形假设.
从经验上看,这对于包括文本数据和自然图像在内的许多类型的数据来说都是正确的。事实上,Carlsson等人发现自然图像的高维空间有一个二维嵌入,它与Klein瓶子是同胚的[1]。
问题:
对这种现象有没有合理的物理解释?从动力学系统的角度来看,我目前的直觉是,如果我们能够为一个特定的过程收集大量数据,那么这个过程必须是稳定的。为什么稳定的物理过程会倾向于具有低维相空间?
有没有更好的物理视角来解释这种现象?
参考文献:
Carlsson,G.,Ishkhanov,T.,de Silva,V.等人,《自然图像空间的局部行为》。国际计算杂志Vis 76,1-12。2008
Charles Fefferman、Sanjoy Mitter和Hariharan Narayanan。测试流形假设。美国数学学会杂志第29卷第4期,2016年10月,第983-1049页。2016
巴斯蒂安·里克(Bastian Rieck)、马库斯·巴纳尔(Markus Banagl)、菲利普·萨德洛(Filip Sadlo)、海克·莱特(Heike Leitte)。用于离散数据分析的持久交集同调。阿尔西夫。2019
D.Chigirev和W.Bialek,最优流形数据表示:信息理论方法,摘自《神经信息处理系统进展》16 161–168,麻省理工学院出版社,马萨诸塞州剑桥,2004年。
T.Roweis和L.K.Saul。局部线性嵌入的非线性降维。科学,290(5500):2323-23262000。
Henry W.Lin、Max Tegmark和David Rolnick。为什么深度学习和廉价学习效果如此好?阿尔西夫。2017