×

从样本中学习代数变化。 (英语) Zbl 1481.13040号

假设在实欧几里德空间中从未知代数簇(即多元多项式方程的零轨迹)中给出点的样本。本文的目的是从取样点中确定未知品种的特征。正如作者所指出的,这是“数据科学和代数几何接口上的一个基本问题”作者调查了广泛的文献,并提出了一些新的算法来解决这些问题。从那些开始学习数据科学和代数几何技术的人到寻找不同方法尝试的专家,本文在许多层面上都是有用的参考。特别有用的是第2节中的一长串示例以及第7节中描述的附带软件(读者可以公开获得)。
作者提出了五个关于未知品种的问题,围绕这五个品种组织论文:
1
(V)的维数是多少?
2
哪些多项式在(V)上消失?
三。
(V)的度数是多少?
4
(V)的不可约分量是什么?
5
(V)的同源群是什么?

在第三节中,作者考虑了流形学习领域中标准的维数估计问题[J.A.李M.Verleysen先生,非线性降维。纽约州纽约市:Springer(2007;兹比尔1128.68024)]. 作者调查了六种不同的维度估计方法。这些是非线性主成分分析、盒子计数、关联维数、持久同源曲线维数[H.亚当斯等,阿贝尔交响乐团。15, 1–31 (2020;Zbl 1448.62211号)],最大似然估计[E.莱文纳P.Bickel先生,“内在维度的最大似然估计”,高级神经信息处理。系统。17,777–784(2004)],以及方差估计分析[迪亚斯先生等,《多元分析杂志》。173, 229–247 (2019;Zbl 1422.62182号)]. 作者在一个尺寸图灵感来自持久同源的条形码。
在第4节中,作者继续进行持久同源性,这是拓扑数据分析的主要内容[G.卡尔森,公牛。美国数学。Soc.,新Ser。46,第2期,255–308(2009年;Zbl 1172.62002号)]. 作者探索使用样本点处未知变量的切线空间(V)来获得椭球体,以细化Vietoris-Rips复合体球体的常规输入。(一旦知道一些方程,就可以估计切线空间——这是第5节考虑的问题。)作者还指出了达到流形的同调学习[P.尼约吉等人,《离散计算》。地理。39,编号1-3,419-441(2008年;兹比尔1148.68048)].
第五节分析了未知变量(V)的方程求解问题。当寻找消失在一组点上的次数为d的多项式方程时,这里的标准方法是通过应用第d个Veronese映射将问题“线性化”。在该映射下,消失在点上的度为d的超曲面空间成为线性空间,更准确地说,它们是范德蒙矩阵(这是一个矩阵,其列记录了Veronese地图下采样点的图像)。作者概述了计算该内核的三种标准方法;对于以浮点坐标给出的采样点,用数字方式进行此操作尤其重要。作者指出,这里的一个问题是,范德蒙德矩阵是出了名的病态矩阵[V.Y.潘,SIAM J.矩阵分析。申请。37,第2期,676–694页(2016年;Zbl 1382.15008号)]. 在试图找到稀疏的方程并通过选择多项式的正交基来避免ill-条件化,这可能会破坏任何所需的稀疏表示。
在第6节中,作者描述了从第5节中导出的方程中提取有关变量(V)的有意义信息的方法。这是计算代数几何的领域。主要得益于Groebner基,符号方法现在在符号计算机代数系统中得到了很好的应用,例如麦考利2,可可、和单一。最近,数值代数几何,是一个不断发展的领域。软件贝尔蒂尼实现这些数值方法(最近同伦Continuation.jl中的包朱莉娅). 作者描述了如何使用这些软件包来解决给定样本的剩余问题(\(V\)的程度、\(V\)的不可约分量等)
最后,第7节使用朱莉娅作者开发的包名为学习代数变化。作者提供了使用该软件包的分步指导。

MSC公司:

13第25页 交换代数的应用(例如,统计、控制理论、优化等)
14第25页 实代数簇的拓扑
62J02型 一般非线性回归
55N31号 持久同源性及其应用,拓扑数据分析
62R40型 拓扑数据分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aamari,E.,Kim,J.,Chazal,F.,Michel,B.,Rinaldo,A.,Wasserman,L.:估算流形的范围。arXiv:1705.04565·兹比尔1418.62100
[2] Adams,H.,Tausz,A.:JavaPlex教程。http://www.math.colotate.edu/adams/research/javaplex_tutorial.pdf。2018年2月24日访问
[3] Améndola,C;福盖尔,J-C;Sturmfels,B,高斯混合的矩变种,J.Algebr。统计,7,14-28,(2016)·Zbl 1361.13017号 ·doi:10.18409/jas.v7i1.42
[4] Basson,R.、Lercier,R.,Ritzenthaler,C.、Sijsling,J.:Lüroth不变量的显式表达。ISSAC 2013。第38届符号与代数计算国际研讨会论文集,第31-36页。ACM,纽约(2013)·Zbl 1360.68915号
[5] Bates,D.、Hauenstein,J.、Sommese,A.、Wampler,C.:用Bertini、软件、环境和工具数值求解多项式系统。宾夕法尼亚州费城SIAM(2013)·兹比尔1295.65057
[6] 贝赞森,J;爱德曼,A;卡宾斯基,S;Shah,V,Julia:一种新的数值计算方法,SIAM Rev.,59,65-98,(2017)·Zbl 1356.68030号 ·数字对象标识代码:10.1137/141000671
[7] 比约克,A;Pereyra,V,Vandermonde方程组的解,数学。计算。,24893-903(1970年)·Zbl 0221.65054号 ·doi:10.1090/S0025-5718-1970-0290541-1
[8] Blekherman,G.,Parrilo,P.,Thomas,R.:半定优化与凸代数几何,MOS-SIAM优化系列,第13卷(2012)·兹比尔1260.90006
[9] Breiding,P.,Timme,S.:同伦Continuation.jl-解决Julia多项式方程组的包。arXiv:1711.10911·Zbl 1396.14003号
[10] 布朗,MW;马丁,S;波洛克,SN;科齐亚斯,EA;Watson,JP,分子结构分析的算法降维,J.Chem。物理。,129, 064118, (2008) ·doi:10.1063/1.2968610
[11] Bürgisser,P.,Cucker,F.,Lairez,P.:计算弱指数时间中基本半代数集的同调性。arXiv公司:1706.07473·Zbl 1426.14016号
[12] 卡马斯塔,F,《数据维度估计方法:调查》,模式识别。,36, 2945-2954, (2003) ·Zbl 1059.68100号 ·doi:10.1016/S0031-3203(03)00176-6
[13] 卡马斯塔,F;Staiano,A,内在维度估计:进展与开放问题,信息科学。,328, 26-41, (2016) ·Zbl 1392.62171号 ·doi:10.1016/j.ins.2015.08.029
[14] Carlsson,G,Topology and data,公牛。美国数学。Soc.,46,255-308,(2009年)·Zbl 1172.62002号 ·doi:10.1090/S0273-0979-09-01249-X
[15] Cifuentes,D;Parrilo,P,平方和程序的采样代数变量,SIAM J.Optim。,27, 2381-2404, (2017) ·Zbl 1386.90099号 ·数字对象标识代码:10.1137/15M1052548
[16] Cox,D.、Little,J.、O'Shea,D.:理想、多样性和算法:计算代数几何和交换代数导论,数学本科生教材,第四版。施普林格,柏林(2015)·Zbl 1335.13001号 ·数字对象标识代码:10.1007/978-3-319-16721-3
[17] Cueto,M.A.,Morton,J.,Sturmfels,B.:受限Boltzmann机器的几何。统计学和概率的代数方法。《当代数学》,第516卷,第135-153页。AMS,普罗维登斯(2010)·Zbl 1513.62019年
[18] Daleo,N.,Hauenstein,J.:从数值上决定射影方案的Cohen-Macaulay性。J.塞姆。计算。72,128-146(2016)·Zbl 1329.14108号
[19] Demmel,J.W.:应用数值线性代数。SIAM,费城(1997)·Zbl 0879.65017号 ·doi:10.137/1.9781611971446
[20] Deza,M.,Laurent,M.:切割和度量几何,算法和组合数学,第15卷。施普林格,柏林(1997)·兹比尔0885.52001 ·doi:10.1007/978-3-642-04295-9
[21] Diaconis,P;霍姆斯,S;Shahsahani,M,《从歧管中取样》,Inst.Math。统计收集。,10, 102-125, (2013) ·Zbl 1356.62015年 ·doi:10.1214/12-IMSCOLL1006
[22] Díaz,M.,Quiroz,A.,Velasco,M.:从流形上的数据估计局部角度和维数。arXiv:1805.01577
[23] Draisma,J;霍罗贝,E;Ottaviani,G;Sturmfels,B;Thomas,R,代数簇的欧氏距离度,Found。计算。数学。,16, 99-149, (2016) ·兹比尔1370.51020 ·doi:10.1007/s10208-014-9240-x
[24] Drton,M.,Sturmfels,B.,Sullivant,S.:代数统计学讲座,Oberwolfach研讨会,第39卷。Birkhäuser,巴塞尔(2009年)·Zbl 1166.13001号 ·doi:10.1007/978-3-7643-8905-5
[25] Dufresne,E.,Edwards,P.,Harrington,H.,Hauenstein,J.:拓扑数据分析的实代数变量采样。arXiv:1802.07716
[26] Eklund,D.:瓶颈的数值代数几何。arXiv:1804.01015
[27] 费德勒,H,曲率测量,Trans。美国数学。《社会学杂志》,93,418-491,(1959)·Zbl 0089.38402号 ·doi:10.1090/S0002-9947-1959-0110078-1
[28] Griffin,Z.,Hauenstein,J.,Peterson,C.,Sommese,A.:希尔伯特函数的数值计算和零维格式的正则性。代数之间的联系。组合数学与几何,《Springer数学与统计学报》,第76卷,第235-250页。施普林格,纽约(2014)·Zbl 1315.13032号
[29] Harris,J.:代数几何。第一门课程,数学研究生教材,第133卷。施普林格,纽约(1992)·Zbl 0779.14001号
[30] Henselman,G.,Ghrist,R.:拟阵过滤和计算持久同源性。arXiv:1606.00199
[31] Higham,N.:《数值算法的准确性和稳定性》,第2版。SIAM,费城(2002)·Zbl 1011.65010号
[32] Horobeţ,E.,Weinstein,M.:偏移超曲面和代数簇的持久同调。arXiv:1803.07281
[33] Howard,R.:黎曼齐次空间中的运动学公式。内存。美国数学。索克。106(509) (1993) ·Zbl 0810.53057号
[34] Jain,A.,Dubes,R.:聚类数据算法。新泽西州上鞍河普伦蒂斯·霍尔(1998)·Zbl 0665.62061号
[35] 基列,J;库克洛娃,Z;Pajdla,T;Sturmfels,B,畸变品种,已发现。计算。数学。,18, 1043-1071, (2018) ·Zbl 1408.14191号 ·doi:10.1007/s10208-017-9361-0
[36] Kummer,M.,Vinzant,C.:倒数线性空间的Chow形式。密歇根数学。J.arXiv公司:1610.04584
[37] Landsberg,J.M.:张量:几何与应用,数学研究生院,第128卷。美国数学学会,普罗维登斯,RI(2012)·兹伯利1238.15013
[38] Lee,J.A.,Verleysen,M.:非线性降维。信息科学与统计。施普林格,纽约(2007)·Zbl 1128.68024号 ·数字对象标识代码:10.1007/978-0-387-39351-3
[39] Leichtweiss,K,Zur riemannschen geometrie in grassmannschen-mannigfaltigkeiten,Math。Z.,76,334-366,(1961)·Zbl 0113.37102号 ·doi:10.1007/BF01210982
[40] 列维纳,E;Bickel,P,内在维度的最大似然估计,高级神经网络过程。系统。,17, 777-784, (2004)
[41] 马,Y;杨,A;德克森,H;Fossum,R,《子空间排列估计及其在混合数据建模和分段中的应用》,SIAM Rev.,50,413-458,(2008)·Zbl 1147.52010年 ·doi:10.1137/060655523
[42] 马丁,S;汤普森,A;科齐亚斯,EA;Watson,JP,《环辛烷能源景观拓扑》,J.Chem。物理。,132, 234115, (2010) ·doi:10.1063/1.3445267
[43] Mezzadri,F,如何从经典紧群生成矩阵,Not。AMS,54,592-604,(2007)·Zbl 1156.22004年
[44] Möller,H.,Buchberger,B.:带预赋值零的多元多项式的构造。《计算机代数》(马赛,1982年)。计算机科学课堂讲稿,第144卷,第24-31页。柏林施普林格出版社(1982)·Zbl 0549.68026号
[45] Mustaţ,M.:射影簇上一般有限点子集的分次Betti数。布拉马特。1997 Mat.(卡塔尼亚)53, 53-81 (1998) ·Zbl 0943.13010号
[46] Niyogi,P;斯梅尔,S;Weinberger,S,从随机样本中寻找高置信度子流形的同源性,离散计算。地理。,39, 419-441, (2008) ·Zbl 1148.68048号 ·doi:10.1007/s00454-008-9053-2
[47] Olver,PJ,关于多元插值,Stud.Appl。数学。,116, 201-240, (2006) ·Zbl 1145.41311号 ·文件编号:10.1111/j.1467-9590.2006.00335.x
[48] Pan,VY,Vandermonde矩阵有多糟糕?,SIAM J.矩阵分析。申请。,37, 676-694, (2016) ·Zbl 1382.15008号 ·数字对象标识代码:10.1137/15M1030170
[49] 普劳曼,D;Sturmfels,B;Vinzant,C,《四次曲线及其双切线》,J.Symb。计算。,46, 712-733, (2011) ·Zbl 1214.14049号 ·doi:10.1016/j.jsc.2011.01.007
[50] Santalo,L.:积分几何与几何概率。Addison-Wesley,雷丁(1976)·Zbl 0342.53049号
[51] Sturmfels,B;Welker,V,统计排名的交换代数,J.代数,361,264-286,(2012)·Zbl 1316.13042号 ·doi:10.1016/j.代数.2012.03.028
[52] 科罗拉多州立大学模式分析实验室:通过持久同源性测量的分形维数(预打印)(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。