×

用于快速距离和相似性估计的二进制向量。 (英语。俄文原件) Zbl 1366.93641号

赛博。系统。分析。 53,编号138-156(2017); 翻译自Kibern。西斯特。分析。2017年第1期,第160-183页(2017年)。
摘要:本综述考虑了从向量表示中快速估计初始数据之间距离/相似性度量的方法和算法,初始数据主要是具有不同距离度量的高维向量(角度向量、欧几里德向量和其他向量),初始数据具有二进制或整值分量和相似性度量(余弦、内积和其他)。讨论了主要使用随机投影和后续量化以及采样方法的无学习方法。获得的向量可以应用于相似性搜索、机器学习和其他算法。

MSC公司:

93E10型 随机控制理论中的估计与检测
93E03型 控制理论中的随机系统(一般)
68T05型 人工智能中的学习和自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] D.A.Rachkovskij,“用于快速距离和相似性估计的实值嵌入和草图”,《控制论和系统分析》,第52卷,第6期,967-988(2016)·Zbl 1359.62261号 ·数字对象标识码:10.1007/s10559-016-9899-x
[2] M.Deza和E.Deza,《距离百科全书》,斯普林格,柏林-海德堡(2016)·Zbl 1351.51001号 ·doi:10.1007/978-3-662-52844-0
[3] M.-J.Lesot、M.Rifqi和H.Benhadda,“二进制和数值数据的相似性度量:一项调查”,《国际知识工程与软数据范式》,第1卷,第1期,63-84页(2009年)。 ·doi:10.1504/IJKESDP.2009.021985
[4] S.-S.Choi、S.-H.Cha和C.C.Tappert,“二元相似性和距离测量的调查”,《系统学、控制论和信息学》,第8卷,第1期,43-48(2010)。
[5] W.B.Johnson和J.Lindenstrauss,“Lipshitz映射到Hilbert空间的扩展”,《当代数学》,第26卷,189-206(1984)·Zbl 0539.46017号 ·doi:10.1090/conm/026/737400
[6] P.Indyk和R.Motwani,“近似最近邻:消除维度诅咒”,摘自:Proc。第30届ACM交响乐团。《计算理论》(1998),第604-613页·Zbl 1029.68541号
[7] S.S.Vempala,《随机投影法》,美国数学。罗德岛州普罗维登斯市(2004年)·Zbl 1058.68063号
[8] J.Matousek,“关于Johnson-Lindenstraus引理的变体”,《随机结构与算法》,第33卷,第2期,142-156(2008)·Zbl 1154.51002号 ·doi:10.1002/rsa.20218
[9] A.Andoni、R.Krauthgamer和I.P.Razenshteyn,“草图和嵌入等同于规范”,摘自:Proc。STOC’15(2015),第479-488页·Zbl 1321.68428号
[10] T.Batu、F.Ergun和C.Sahinalp,《忽略字符串嵌入和编辑距离近似值》,摘自:Proc。SODA’06(2006),第792-801页·Zbl 1192.68344号
[11] P.Indyk和A.Naor,“最近邻保留嵌入”,ACM Trans。《算法》,第3卷,第3期,第31条(2007年)·Zbl 1192.68748号
[12] M.Goemans和D.Williamson,“使用半定规划改进最大割和可满足性问题的近似算法”,Journ。ACM,第42卷,第6期,1115-1145(1995)·Zbl 0885.68088号 ·数字对象标识代码:10.1145/227683.2276884
[13] M.Charikar,“取整算法中的相似性估计技术”,摘自:Proc。STOC'02,380-388(2002)·Zbl 1192.68226号
[14] X.Yi、C.Caramanis和E.Price,“二进制嵌入:基本极限和快速算法”,JMLR:W&CP,第37卷,2162-2170(2015)。
[15] G.S.Manku、A.Jain和A.D.Sarma,“检测网络爬行的近重复”,摘自:Proc。WWW’07(2007),第141-150页。
[16] P.Li、T.J.Hastie和K.W.Church,“利用边缘信息改进随机投影”,摘自:Proc。COLT’06(2006),第635-649页·Zbl 1143.68547号
[17] F.X.Yu、A.Bhaskara、S.Kumar、Y.Gong和S.-F.Chang,《关于使用循环矩阵进行二进制嵌入》,arXiv:1511.06480(2015)·兹比尔1462.68172
[18] D.A.Rachkovskij、I.S.Misuno和S.V.Slipchenko,“构建二进制稀疏向量表示的随机投影方法”,《控制论与系统分析》,第48卷,第1期,第140-150页(2012年)·Zbl 1276.68144号 ·doi:10.1007/s10559-012-9384-0
[19] D.A.Rachkovskij,“通过随机二进制投影估计向量相似性”,《控制论与系统分析》,第51卷,第5期,808-818(2015)·Zbl 1347.68291号 ·doi:10.1007/s10559-015-9774-1
[20] G.W.Oehlert,“关于delta方法的注释”,《美国统计学家》,第46卷,第1期,第27-29页(1992年)。
[21] L.Jacques、J.N.Laska、P.T.Boufounos和R.G.Baraniuk,“通过稀疏向量的二进制稳定嵌入实现稳健的1位压缩感知”,IEEE Trans。Inf.Theory,第59卷,第4期,2082-2102(2013)·Zbl 1364.94130号 ·doi:10.1109/TIT.2012.2234823
[22] L.Jacques,“量子化Johnson-Lindenstraus引理:布冯针的发现”,IEEE Trans。《信息论》,第61卷,第9期,5012-5027(2015)·Zbl 1359.81065号 ·doi:10.1109/TIT.2015.2453355
[23] D.E.Knuth,“大omicron、大omega和大θ”,ACM Sigact News,第8卷,第2期,第18-24页(1976年)。 ·doi:10.1145/1008328.1008329
[24] Z.Karnin、Y.Rabani和A.Shpilka,“显式降维及其应用”,SIAM J.Compute。,第41卷,第1期,219-249(2012)·Zbl 1253.68154号 ·doi:10.1137/10828812
[25] K.G.Larsen和J.Nelson,Johnson-Lindenstraus引理的最优性,arXiv:1609.02094(2016)·Zbl 1394.46009号
[26] Y.Plan和R.Vershynin,“随机超平面细分的降维”,《离散与计算几何》,第51卷,第2期,438-461(2014)·Zbl 1296.52014年 ·doi:10.1007/s00454-013-9561-6
[27] S.Oymak和B.Recht,任意集二进制嵌入的近最优界,arXiv:1512.04433(2015)·Zbl 0971.68204号
[28] N.Ailon和B.Chazelle,“快速Johnson-Lindenstraus变换和近似最近邻”,SIAM J.Compute。,第39卷,第1期,302-322(2009)·Zbl 1185.68327号 ·数字对象标识代码:10.1137/060673096
[29] Q.Le、T.Sarlos和A.J.Smola,“快餐——计算对数线性时间内的希尔伯特空间扩展”,JMLR:W&CP,第28卷,第3期,第244-252页(2013年)。
[30] S.Oymak,循环二进制嵌入的近最优样本复杂度界限,arXiv:1603.03178(2016)·Zbl 1235.68161号
[31] 谢家华、吕春生和裴春生,“通过循环下采样矩阵进行快速二进制嵌入:一种与数据无关的方法”,见:Proc。ICIP’16(2016)·兹比尔1225.68175
[32] A.Choromanska、K.Choromaski、M.Bojarski、T.Jebara、S.Kumar和Y.LeCun,“结构化散列投影的二进制嵌入”,见:Proc。ICML’16(2016),第344-353页·Zbl 0583.68059号
[33] S.Dirksen和A.Stollenwerk,《高斯循环矩阵的快速二进制嵌入:改进边界》,arXiv:1608.06498(2016)·Zbl 1409.60023号
[34] P.Li、T.J.Hastie和K.W.Church,“非常稀疏的随机投影”,摘自:Proc。KDD’06(2006),第287-296页·Zbl 1234.68421号
[35] D.A.Rachkovskij,“用随机二进制投影形成反映相似性的二进制向量”,《控制论与系统分析》,第51卷,第2期,313-323(2015)·Zbl 1317.93233号 ·doi:10.1007/s10559-015-9723-z
[36] V.Korolev和I.Shevtsova,“Berry-Esseen不等式的改进及其对泊松和混合泊松随机和的应用”,《斯堪的纳维亚精算杂志》,2012年第2期,第81-105页(2012年)·Zbl 1277.60042号 ·doi:10.1080/03461238.2010.485370
[37] Y.Gong、K.Sanjiv、H.A.Rowley和S.Lazebnik,“使用双线性投影学习高维数据的二进制代码”,摘自:Proc。CVPR’13(2013),第484-491页·Zbl 0963.68078号
[38] X.Zhang、F.X.Yu、R.Guo、S.Kumar、S.Wang和S.-F.Chang,“基于kronecker积的快速正交投影”,摘自:Proc。ICCV’15(2015),第2929-2937页。
[39] P.Indyk和R.Motwani,“近似最近邻:消除维度诅咒”,摘自:Proc。第30届ACM交响乐团。《计算理论》(1998),第604-613页·Zbl 1029.68541号
[40] A.Gionis、P.Indyk和R.Motwani,“通过散列在高维中进行相似性搜索”,摘自:Proc。VLDB’99(1999),第518-529页。
[41] A.Andoni和P.Indyk,“高维近似最近邻的近优散列算法,ACM通信,第51卷,第1期,117-122(2008)·数字对象标识代码:10.1145/1327452.1327494
[42] A.Andoni,“最近邻居搜索:旧的、新的和不可能的”,麻省理工学院博士论文(2009年)。
[43] J.Wang、H.T.Shen、J.Song和J.Ji,《相似性搜索的哈希:一项调查》,arXiv:1408.2927(2014)。
[44] P.Li、M.Mitzenmacher和A.Shrivastava,“随机投影的编码”,摘自:Proc。ICML’14(2014),第676-684页。
[45] S.Shalev-Shwartz、Y.Singer和N.Srebro,“Pegasos:SVM的原始估计子梯度解算器”,摘自:Proc。ICML’2007(2007),第807-814页·Zbl 1211.90239号
[46] R.-E.Fan、K.-W.Chang、C.-J.Hsieh、X.-R.Wang和C.J.Lin,“LIBLINEAR:大型线性分类库”,《机器学习研究杂志》,第9卷,1871-1874(2008)·Zbl 1225.68175号
[47] T.Joachims、T.Finley和C.-N.J.Yu,“结构SVM的切割平面训练”,机器学习,第77卷,第1期,27-59(2009)·Zbl 1235.68161号 ·doi:10.1007/s10994-009-5108-8
[48] T.Martinetz、K.Labusch和D.Schneegas,“SoftDoubleMaxMinOver:支持向量机的类感知器训练”,IEEE神经网络学报,第20卷,第7期,1061-1072(2009)。 ·doi:10.1109/TNN.2009.2016717
[49] L.Bottou,“随机梯度下降的大规模机器学习”,摘自:Proc。COMPSTAT’10(2010),第177-187页·Zbl 1436.68293号
[50] M.Datar、N.Immorlica、P.Indyk和V.S.Mirrorkni,“基于P-稳定分布的局部敏感哈希方案”,摘自:Proc。SCG’04(2004),第253-262页·Zbl 1373.68193号
[51] P.Li、M.Mitzenmacher和A.Shrivastava,《2位随机投影、非线性估计和近似近邻搜索》,arXiv:1602.06577(2016)·Zbl 1357.68178号
[52] D.Gorisse、M.Cord和F.Precioso,“chi2距离的局部敏感散列”,IEEE Ttrans。PAMI,第34卷,第2期,402-409(2012)。 ·doi:10.1109/TPAMI.2011.193
[53] P.Li、G.Samorodnitsky和J.Hopcroft,“符号柯西投影和奇方核”,摘自:Proc。NIPS’13,2571-2579(2013)·Zbl 1151.30007号
[54] P.Li,《大规模学习的符号稳定随机投影》,arXiv:1504.07235(2015)。
[55] A.Dasgupta、R.Kumar和T.Sarlos,“快速位置敏感散列”,摘自:Proc。SIGKDD’11(2011),第1073-1081页·Zbl 1007.68997号
[56] L.Pauleve、H.Jegou和L.Amsaleg,“位置敏感哈希:哈希函数类型和查询机制的比较”,模式识别。莱特。,第31卷,第11期,1348-1358(2010)。 ·doi:10.1016/j.patrec.2010.04.004
[57] P.Li,“0位一致加权采样”,摘自:Proc。KDD’15(2015),第665-674页。
[58] 李鹏,非线性核的比较研究,arXiv:1603.06541。(2016). ·Zbl 1225.68175号
[59] M.Manasse、F.McSherry和K.Talwar,“一致加权采样”,技术代表MSR-TR-2010-73(2010)。
[60] S.Ioffe,“改进的一致采样、加权最小散列和一级草图绘制”,摘自:Proc。ICDM’10(2010),第246-255页。
[61] B.Haeupler、M.Manasse和K.Talwar,《一致加权抽样快速、小且容易》,arXiv:1410.4266(2014)·Zbl 1317.93233号
[62] A.Shrivastava,“简单高效的加权最小值散列”,摘自:Proc。NIPS’16(2016)。
[63] M.Thorup,“Bottom-k和优先级抽样,以最小独立性设置相似性和子集和”,摘自:Proc。STOC’13(2013),第371-378页·Zbl 1293.68107号
[64] P.Li,广义最小最大核和广义一致加权抽样,arXiv:1605.05721(2016)。
[65] P.Li和C.-H.Zhang,GMM内核理论,arXiv:1608.00550(2016)·Zbl 1185.68327号
[66] P.Li,Nystrom近似GMM核的方法,arXiv:1607.03475(2016)。
[67] N.Cristianini和J.Shawe-Taylor,《支持向量机和其他基于内核的学习方法简介》,剑桥大学出版社,英国剑桥(2000)·Zbl 0994.68074号 ·doi:10.1017/CBO9780511801389
[68] I.Steinwart和A.Christmann,支持向量机,Springer,纽约(2008)·兹比尔1203.68171
[69] T.Hofmann、B.Scholkopf和A.Smola,“机器学习中的核心方法”,《统计学年鉴》,第36卷,第3期,1171-1220(2008)·Zbl 1151.30007号 ·doi:10.1214/00905360000000677
[70] N.Shervashidze、P.Schweitzer、E.J.van Leeuwen、K.Mehlhorn和K.M.Borgwardt,“Weisfeiler-Lehman图形内核”,《机器学习研究杂志》,第2卷,2539-2561(2011)·Zbl 1280.68194号
[71] M.M.Luqman、J.Y.Ramel、J.Llados和T.Brouard,“模糊多级图嵌入”,模式识别,第46卷,第2期,551-565页(2013年)·Zbl 1251.68191号 ·doi:10.1016/j.patcog.2012.07.029
[72] L.Livi、A.Rizzi和A.Sadeghian,“标记图的优化差异空间嵌入”,《信息科学》,第266卷,第47-64页(2014年)。 ·doi:10.1016/j.ins.2014.01.005
[73] M.Neumann、R.Garnett、C.Bauckhage和K.Kersting,“传播核:来自传播信息的有效图形核”,机器学习,第102卷,第2期,209-245(2016)·Zbl 1357.68178号 ·doi:10.1007/s10994-015-5517-9
[74] T.Gartner、J.Lloyd和P.Flach,“结构化数据的内核和距离”,《机器学习》,第57卷,第3期,205-232(2004)·Zbl 1079.68086号 ·doi:10.1023/B:MACH.0000039777.23772.30
[75] K.Shin和T.Kuboyama,“Haussler卷积核的推广-映射核及其在树核中的应用”,J.Compute。科学。技术。,第25卷,第5期,1040-1054(2010)。 ·doi:10.1007/s11390-010-9386-1
[76] G.Da San Martino、N.Navarin和A.Sperduti,《基于树的图形内核》,摘自:Proc。ICDM’12(2012),第975-986页·Zbl 1364.94130号
[77] N.Kriege和P.Mutzel,“属性图的子图匹配内核”,摘自:Proc。ICML’12(2012),第1015-1022页。
[78] A.Rahimi和B.Recht,“大型内核机器的随机特性”,摘自:Proc。NIPS’07(2007),第1177-1184页。
[79] M.Raginsky和S.Lazebnik,“来自移位不变内核的局部敏感二进制代码”,摘自:Proc。NIPS’09(2009),第1509-1517页·Zbl 1154.51002号
[80] S.Kim和S.Choi,“位置敏感二进制码的双线性随机投影”,摘自:Proc。CVPR’15(2015),第1338-1346页。
[81] B.Kulis和K.Grauman,“内核化位置敏感散列”,IEEE Trans。PAMI,第34卷,第6期,1092-1104(2012)。 ·doi:10.1109/TPAMI.2011.219
[82] K.Jiang、Q.Que和B.Kulis,“重温核化局部敏感散列以改进大规模图像检索”,摘自:Proc。CVPR’15(2015),第4933-4941页。
[83] H.Xia、P.Wu、S.C.Hoi和R.Jin,“为可扩展图像检索增强多内核位置敏感哈希”,发表于:Proc。SIGIR’12(2012),第55-64页。
[84] P.Li、A.Shrivastava、J.L.Moore和A.C.König,“大规模学习的散列算法”,摘自:Proc。NIPS’11(2011),第2672-2680页·Zbl 1347.68291号
[85] P.Li和A.C.König,“b位最小散列的理论和应用”,《ACM的通信》,第54卷,第8期,第101-109页(2011年)。 ·doi:10.1145/1978542.1978566
[86] E.Kushilevitz、R.Ostrovsky和Y.Rabani,“高效搜索高维空间中的近似最近邻”,《SIAM计算杂志》,第30卷,第2期,457-474(2000)·Zbl 0963.68078号 ·doi:10.1137/S0097539798347177
[87] P.Li和K.W.Church,“估算双向和多向关联的草图算法”,计算语言学,第33卷,第3期,305-354(2007)·Zbl 1234.68421号 ·doi:10.1162/coli.2007.33.3.305
[88] P.Li、K.W.Church和T.J.Hastie,《全民素描:条件随机抽样的理论和应用》,摘自:Proc。NIPS’08(2008),第953-960页。
[89] P.Flajolet和G.N.Martin,“数据库应用的概率计数算法”,J.Compute。系统科学。,第31卷,182-209(1985)·Zbl 0583.68059号 ·doi:10.1016/0022-0000(85)90041-8
[90] E.Cohen,“具有传递闭包和可达性应用的规模估算框架”,J.Compute。系统科学。,第55卷,441-453(1997)·Zbl 0897.68075号 ·doi:10.1006/jcss.1997.1534
[91] E.Cohen,“所有实例草图,重访:大规模图形分析的HIP估计值”,摘自:Proc。PODS’14(2014),第88-99页。
[92] A.Z.Broder,“关于文件的相似性和包容性”,摘自:Proc。序列’97(1997),第21-29页。
[93] A.Z.Broder、S.C.Glassman、M.S.Manasse和G.Zweig,“网络的句法聚类”,《计算机网络和ISDN系统》,第29卷,第8-13期,第1157-1166页(1997年)。 ·doi:10.1016/S0169-7552(97)00031-7
[94] A.Z.Broder、M.Charikar、A.M.Frieze和M.Mitzenmacher,“Min-wise独立排列”,《计算杂志》。系统科学。,第60卷,327-336(1998)·Zbl 1007.68997号
[95] M.Mitzenmacher、R.Pagh和N.Pham,“使用奇怪草图对高度相似性进行有效评估”,摘自:Proc。WWW’14(2014),第109-118页·Zbl 0897.68075号
[96] P.Indyk,“近似最小独立的散列函数族”,《算法杂志》,第38卷,第1期,84-90(2001)·Zbl 0971.68204号 ·doi:10.1006/jagm.2000.1131
[97] M.Patrascu和M.Thorup,“关于线性探测和minwise独立所需的k独立性”,ACM Trans。《算法》,第12卷,第1期,8:1-8:27(2016)·Zbl 1288.68050号
[98] S.Dahlgard和M.Thorup,“扭曲表格的近似最小独立性”,摘自:Proc。SWAT’14(2014),第134-145页·Zbl 1417.68037号
[99] M.Thorup,“使用表格进行快速而强大的散列,arXiv:1505.01523。(2016). ·Zbl 0583.68059号
[100] M.Mitzenmacher和S.Vadhan,“为什么简单的散列函数有效:利用数据流中的熵”,摘自:Proc。SODA’08(2008),第746-755页·Zbl 1192.68202号
[101] P.Li、A.B.Owen和C.H.Zhang,“一个置换散列”,摘自:Proc。NIPS’12(2012),第3122-3130页。
[102] M.Charikar、K.Chen和M.Farach-Colton,“在数据流中查找频繁项”,摘自:Proc。ICALP’02(2002),第693-703页·Zbl 1057.68600号
[103] P.Flajolet,爱沙尼亚。Fusy,O.Gandouet和F.Meunier,“Hyperloglog:近最优基数估计算法的分析”,摘自:Proc。AofA'07(2007),第127-146页·Zbl 1192.68959号
[104] A.Shrivastava和P.Li,“通过旋转加密一个置换散列以实现快速近邻搜索”,摘自:Proc。ICML’14(2014),第557-565页。
[105] A.Shrivastava和P.Li,“一个置换散列的改进致密化”,摘自:Proc。UAI’14(2014),第732-741页。
[106] S.Dahlgaard、M.B.T.Knudsen、E.Rotenberg和M.Thorup,“k分区上的统计散列”,摘自:Proc。FOCS’15(2015),第1292-1310页。
[107] D.Valsesia、S.M.Fosson、C.Ravazzi、T.Bianchi和E.Magli,“SparseHash:在信号支持之间嵌入Jaccard系数”,载于:ICME 2016研讨会(2016),第1-16页。
[108] E.M.Kussul、D.A.Rachkovskij和T.N.Baidyk,“联想-投射神经网络:架构、实现、应用”,摘自:Proc。Neuro-Nimes’91(1991),第463-476页。
[109] D.A.Rachkovskij、E.M.Kussul和T.N.Baidyk,“使用结构敏感的稀疏二进制分布式表示构建世界模型”,《生物启发认知架构》,第3卷,第64-86页(2013年)。 ·doi:10.1016/j.bica.2012.09.004
[110] D.Kleyko、E.Osipov和D.A.Rachkovskij,“使用稀疏分布表示修改全息图神经元”,见《Procedia计算机科学》,第88卷,第39-45页(2016年)。
[111] A.Kartashov、A.Frolov、A.Goltsev和R.Folk,“类Willshaw自联想网络的检索质量和效率:III.Willshaw-Potts模型”,《网络:神经系统中的计算》,第8卷,第1期,71-86(1997)·Zbl 0908.68053号 ·doi:10.1088/0954-898X_8_1_007
[112] A.A.Frolov、D.A.Rachkovskij和D.Husek,“关于Willshaw样自动联想记忆的信息特征”,《神经网络世界》,第12卷,第2期,141-158(2002)。
[113] A.A.Frolov、D.Husek和D.A.Rachkovskij,“在联想记忆中搜索相似二进制向量的时间”,《控制论与系统分析》,第42卷,第5期,615-623(2006)·Zbl 1117.68065号 ·doi:10.1007/s10559-006-0098-z
[114] K.Eshghi和M.Kafai,“具有稀疏二进制高维特征向量的支持向量机”,HPE-2016-30(2016)。
[115] N.M.Amosov、T.N.Baidyk、A.D.Goltsev、A.M.Kasatkin、L.M.Kasartkina、E.M.Kussul和D.A.Rachkovskij,《神经计算机和智能机器人(俄语)》,基辅Naukova Dumka(1991)。
[116] E.M.Kussul、D.A.Rachkovskij和T.N.Baidyk,“通过联想投射神经计算机进行图像纹理识别”,摘自:Proc。ANNIE’91(1991),第453-458页。
[117] R.Donaldson、A.Gupta、Y.Plan和T.Reimer,《为商业搜索引擎设计的随机映射》,arXiv:1507.05929(2015)。
[118] B.A.Olshausen和D.J.Field,“感官输入的稀疏编码”,当前。操作。神经生物学。,第14卷,481-487(2004)。 ·doi:10.1016/j.conb.2004.07.007
[119] S.Ahmad和J.Hawkins,神经元如何在稀疏分布表征上运作?稀疏性、神经元和活性枝晶的数学理论,arXiv:1601.00720(2016)。
[120] I.S.Misuno、D.A.Rachkovskij和S.V.Slipchenko,“反映单词语义相关性的向量和分布式表示”,《数学机器与系统》,第3期,50-67页(2005年)。
[121] I.S.Misuno、D.A.Rachkovskij、S.V.Slipchenko和A.M.Sokolov,“借助向量表示搜索文本信息”,《编程问题》,第4期,第50-59页(2005年)。
[122] Q.Shi、J.Petterson、G.Dror、J.Langford、A.J.Smola和S.V.N.Vishwanathan,“结构化数据的哈希核”,J.Mach。学习。研究,第10卷,2615-2637(2009)·Zbl 1235.68188号
[123] D.A.Rachkovskij、S.V.Slipchenko、E.M.Kussul和T.N.Baidyk,“标量的稀疏二进制分布式编码”,《自动化与信息科学杂志》,第37卷,第6期,第12-23页(2005年)。 ·数字对象标识代码:10.1615/J
[124] D.A.Rachkovskij、S.V.Slipchenko、I.S.Misuno、E.M.Kussul和T.N.Baidyk,“数字向量的稀疏二进制分布编码”,《自动化与信息科学杂志》,第37卷,第11期,47-61(2005)。 ·数字对象标识代码:10.1615/J
[125] D.A.Rachkovskij、S.V.Slipchenko、E.M.Kussul和T.N.Baidyk,“分布式二进制数据表示的绑定过程”,《控制论与系统分析》,第41卷,第3期,第319-331页(2005年)·Zbl 1102.68457号 ·doi:10.1007/s10559-005-0066-z
[126] E.M.Kussul、D.A.Rachkovskij和D.C.Wunsch,“实值向量的随机子空间粗编码方案”,摘自:Proc。IJCNN’99(1999),第450-455页。
[127] D.A.Rachkovskij、S.V.Slipchenko、E.M.Kussul和T.N.Baidyk,“随机子空间RSC方案的数字代码属性”,《控制论与系统分析》,第41卷,第4期,509-520(2005)·兹比尔1103.68719 ·doi:10.1007/s10559-005-0086-8
[128] K.Eshghi和M.Kafai,“CRO内核:对稀疏的高维随机特征映射使用伴随的秩序散列”,摘自:Proc。ICDE’16(2016),第721-730页。
[129] K.Forbus、R.Ferguson、A.Lovett和D.Gentner,“扩展SME以处理大规模认知建模”,DOI:10.1111/cogs.12377(2016)。
[130] D.A.Rachkovskij和S.V.Slipchenko,“基于相似性的检索与结构敏感的稀疏二进制分布式表示”,《计算智能》,第28卷,第1期,106-129(2012)。 ·文件编号:10.1111/j.1467-8640.2011.00423.x
[131] D.A.Rachkovskij,“具有结构敏感分布式表示的类比映射的一些方法”,《实验和理论人工智能》,第16卷,第3期,125-145(2004)·Zbl 1083.68581号 ·doi:10.1080/09528130410001712862
[132] S.V.Slipchenko和D.A.Rachkovskij,“使用二进制分布式表示的相似性进行类比映射”,《国际信息理论与应用》,第16卷,第3期,269-290(2009)。
[133] L.Jacques,《小宽度,低失真:量化亚高斯随机投影的准等体积嵌入》,arXiv:1504.06170(2015)。
[134] L.Jacques和V.Cambareri,《抖动时间:通过受限等距特性的快速量化随机嵌入》,arXiv:1607.00816(2016)·Zbl 1386.94031号
[135] P.T.Boufounos、H.Mansour、S.Rane和A.Vetro,“有效检索和分类视觉特征的降维”,APSIPA Trans。《信号和信息处理》,第5卷,第e14期,第1-14页(2016年)。
[136] P.T.Boufounos、S.Rane和H.Mansour,《信号几何的表示和编码》,arXiv:1512.07636(2015)·Zbl 1386.94021号
[137] Q.Lv、M.Charikar和K.Li,“紧凑数据结构的图像相似性搜索”,摘自:Proc。CIKM'04(2004),第208-217页。
[138] Z.Wang、W.Dong、W.Josephson、Q.Lv、M.Charikar和K.Li,“确定草图尺寸:相似性搜索的基于排名的分析”,摘自:Proc。SIGMETRICS’07(2007),第157-168页。
[139] W.Dong、M.Charikar和K.Li,“高维空间相似性搜索草图的非对称距离估计”,摘自:Proc。SIGIR’08(2008),第123-130页。
[140] K.Min、L.Yang、J.Wright、L.Wu、X.-S.Hua和Y.Ma,“紧凑投影:具有实际记忆要求的简单高效近邻搜索”,摘自:Proc。CVPR’10(2010),第3477-3484页。
[141] E.Chávez、G.Navarro、R.Baeza-Yates和J.L Marroquin,“在度量空间中搜索”,《ACM计算调查》,第33卷,第3期,273-321页(2001年)。 ·数字对象标识代码:10.1145/502807.502808
[142] P.Zezula、G.Amato、V.Dohnal和M.Batko,《相似性搜索:度量空间方法》,纽约斯普林格出版社(2006年)·Zbl 1119.68062号
[143] G.R.Hjaltason和H.Samet,“度量空间中的索引驱动相似性搜索”,《ACM数据库系统事务》,第28卷,第4期,517-580(2003)。 ·数字对象标识代码:10.1145/958942.958948
[144] A.Becker、L.Ducas、N.Gama和T.Laarhoven,“最近邻搜索的新方向与晶格筛分应用”,摘自:Proc。SODA’16(2016),第10-24页·Zbl 1410.68093号
[145] M.Muja和D.G.Lowe,“高维数据的可扩展最近邻算法”,IEEE Trans。关于PAMI,第36卷,第11期,2227-2240(2014)。 ·doi:10.10109/TPAMI.2014.2321376
[146] X.Zhang、J.Qin、W.Wang、Y.Sun和J.Lu,“Hmsearch:一种高效的汉明距离查询处理算法”,摘自:Proc。SSDBM’13(2013),第19:1-19:12页·Zbl 1235.68161号
[147] M.Norouzi、A.Punjani和D.J.Fleet,“使用多索引散列在汉明空间中进行快速精确搜索”,IEEE Trans。PAMI,第36卷,第6期,1107-1119(2014)。 ·doi:10.1109/TPAMI.2013.231
[148] J.Song、H.T.Shen、J.Wang、Z.Huang、N.Sebe和J.Wang.“二进制代码数据库的无距离计算搜索方案”,IEEE Trans。多媒体,第18卷,第3期,484-495(2016)。 ·doi:10.1109/TMM.2016.2515990
[149] N.Pham和R.Pagh,“快速覆盖LSH的可扩展性和总召回”,载于:Proc。CIKM’16(2016)。
[150] Z.Jiang、L.Xie、X.Deng、W.Xu和J.Wang,《汉明空间中的快速最近邻搜索》,摘自:Proc。MMM’16(2016),第325-336页。
[151] J.Wang、W.Liu、S.Kumar和S.-F.Chang,“学习散列索引大数据:调查”,摘自:Proc。IEEE,第104卷,第1期,34-57(2016)。
[152] J.Wang、T.Zhang、J.Song、N.Sebe和H.T.Shen,《关于学习散列的调查》,arXiv:1606.00185(2016)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。