×

数据的范围。 (英语) Zbl 1499.90132号

SIAM J.数学。数据科学。 121-143(2019)第1号第1条; 勘误表同上,第3号,643-646(2019)。
摘要:本文提出并解决了一个新问题,即秩问题,这是指数据集生成其项的有意义排名的固有能力。排名是一项基本的数据科学任务。它的应用非常广泛,包括网络搜索、数据挖掘、网络安全、机器学习和统计学习理论。然而,人们很少关注数据集是否适合排名的问题。因此,当排名方法应用于不可分级的数据集时,结果排名可能不可靠。范围问题提出了以下问题:如何量化范围?动态的、时间演化的图形在哪一点上是可分级的?如果数据集的范围较低,可以进行修改吗?哪些最能提高图形的范围?我们提出了一种求解秩测度的组合方法,并比较了几种计算这种新测度的算法。最后,我们将我们的新度量应用于几个数据集。

MSC公司:

90C08型 线性规划的特殊问题(运输、多指标、数据包络分析等)
90立方厘米 整数编程
52号B12 特殊多边形(线性规划、中心对称等)
90立方厘米 涉及图形或网络的编程

软件:

LOLIB公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] A.Adolfsson、M.Ackerman和N.C.Brownstein,《集群还是不集群:如何回答这个问题》,载于《从数据中发现知识的程序》,加拿大新斯科舍省哈利法克斯,2017年,第1-9页。
[2] I.Ali、W.D.Cook和M.Kress,关于比赛的最低违规排名,管理科学。,32(1986),第660-672页·Zbl 0601.90003号
[3] R.D.Armstrong、W.D.Cook和L.M.Seiford,《优先级排序和共识形成:关系案例》,管理科学。,28(1982),第638-645页·兹比尔044690005
[4] C.R.Cassady、L.M.Maillart和S.Salman,《排名运动队:可定制的二次分配方法》,《界面》,35(2005),第497-510页。
[5] T.P.Chartier、E.Kreutzer、A.N.Langville和K.E.Pedings,排名向量的敏感性和稳定性,SIAM J.Sci。计算。,33(2011),第1077-1102页,https://doi.org/10.1137/090772745。 ·Zbl 1237.65011号
[6] T.P.Chartier、A.N.Langville、K.Hutson和M.W.Berry,《识别定向网络中的影响力边缘:重大事件、混乱和非传递性》,J.Complex Netw。,2(2014年),第87-109页。
[7] B.J.Coleman,《最小化大学足球排名中的违规比赛分数》,《界面》,35(2005),第483-496页。
[8] W.D.Cook和L.M.Seiford,优先级排序和共识形成,管理科学。,24(1978年),第1721-1732页·Zbl 0491.90006号
[9] K.Fukuda和A.Prodon,《重新审视双重描述方法》,载于《组合数学与计算机科学》,施普林格,柏林,海德堡,1996年,第91-111页。
[10] M.R.Garey和D.S.Johnson,《计算机与难治性:NP-完备性理论指南》,弗里曼,旧金山,1979年·Zbl 0411.68039号
[11] M.Gro¨tschel、M.Junger和G.Reinelt,线性排序问题的割平面算法,Oper。研究,32(1984),第1195-1220页·Zbl 0554.90077号
[12] X.Jiang,L.-H.Lim,Y.Yao,Y.Ye,统计排名和组合霍奇理论,数学。程序。,127(2011),第203-244页·Zbl 1210.90142号
[13] M.G.Kendall和B.B.Smith,《关于配对比较方法》,《生物统计学》,31(1940),第324-345页·Zbl 0023.14803号
[14] A.N.Langville和C.D.Meyer,《排名第一的人:评分和排名项目的科学》,普林斯顿大学出版社,新泽西州普林斯顿,2012年·Zbl 1285.00005号
[15] A.N.Langville、K.Pedings和Y.Yamamoto,最小违规排名法,Optim。《工程》,13(2012),第349-370页·Zbl 1293.65096号
[16] R.Marti和G.Reinelt,线性排序问题:组合优化中的精确和启发式方法,应用。数学。科学。175,斯普林格,海德堡,2011年·Zbl 1213.90005号
[17] S.Mehrotra和Y.Ye,《在线性规划的最优面上寻找内点》,数学。编程,62(1993),第497-515页·Zbl 0803.90089
[18] C.D.Meyer,矩阵分析和应用线性代数,SIAM,费城,2000年·兹比尔0962.15001
[19] J.Moore和M.Ackerman,扰动稳健聚类的基础,第16届国际IEEE数据挖掘会议论文集,2016年。
[20] T.Motzkin、H.Raiffa、G.L.Thompson和R.M.Thrall,双重描述方法,《对游戏理论的贡献》,第2卷,H.W.Kuhn和A.W.Tucker编辑,普林斯顿大学出版社,新泽西州普林斯顿,1953年,第51-73页·Zbl 0050.14201号
[21] A.Newman和S.Vempala,《篱笆是徒劳的:关于线性排序问题的松弛》,载于《整数规划与组合优化》,Springer,Berlin,Heidelberg,2001年,第333-347页·兹比尔1010.90042
[22] M.Oswald、G.Reinelt和H.Seitz,应用mod-k-cuts解决线性排序问题,TOP,17(2009),第158-170页·Zbl 1170.90469号
[23] J.Park,《成对比较中最小违规排序》,预印本,https://arxiv.org/abs/physics/0510242, 2005.
[24] G.Reinelt,《线性排序问题:算法和应用》,Heldermann Verlag,Lemgo,Gemany,1985年·Zbl 0565.68058号
[25] G.Reinelt、M.Gro¨tschel和M.Ju¨nger,线性排序多面体的面,数学。编程,33(1985),第43-60页·Zbl 0577.05035号
[26] S.Schenkerman,通过层次分析过程诱导不存在的秩序,Decis。科学。,28(1997年),第475-482页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。