×

对应于谷歌矩阵第二个特征值的特征向量及其与链接垃圾邮件的关系。 (英语) Zbl 1302.65090号

摘要:谷歌使用PageRank算法来确定网站的相对重要性。垃圾链接是指在网站之间放置链接,除了增加网站的PageRank值之外,没有其他目的。为了给搜索查询一个公平的结果,重要的是要检测一个网站是否被垃圾链接,以便将其从搜索结果中筛选出来。
虽然谷歌矩阵的主要特征向量决定PageRank值,但第二个特征向量可用于检测特定类型的链接垃圾邮件。我们描述了一种计算第二特征值的完整独立特征向量集的有效算法,并解释了该算法如何用于检测链路垃圾邮件。我们演示了该算法在数百万页面的web爬行中的性能。

MSC公司:

2015财年65 矩阵特征值和特征向量的数值计算
68页第10页 搜索和排序
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 塔希尔哈维利瓦拉;Kamvar,Sepandar,《谷歌矩阵的第二特征值》,《2003-20年技术报告》(2003),斯坦福信息实验室·Zbl 1091.68044号
[3] Moler,Cleve,MATLAB实验,(谷歌PageRank(2011),The MathWorks),(第7章)·Zbl 1331.65003号
[4] (Meyer,Carl D.,《矩阵分析和应用线性代数》(2000),工业和应用数学学会:美国宾夕法尼亚州费城工业和应用数学家学会)(第7章和第8章)·兹比尔0962.15001
[5] 艾萨克森,院长L。;理查德·马德森(Richard W.Madsen),《马尔可夫链,理论与应用》(1976),威利出版社(Wiley:Wiley New York)·Zbl 0332.60043号
[6] Tarjan,Robert Endre,深度第一搜索和线性图算法,SIAM J.Compute。,1, 2, 146-160 (1972) ·Zbl 0251.05107号
[8] Meyer,医学博士。;Stadelmaier,M.W.,奇异矩阵与逆正,线性代数应用。,22, 139-156 (1978) ·Zbl 0411.15006号
[9] Ilse C.F.伊普森。;Carl D.Meyer,《Krylov方法背后的理念》,Amer。数学。月刊,105,10,889-899(1998)·Zbl 0982.65034号
[10] van Gijzen,Martin B。;Sonneveld,Peter,《913算法:高效利用双正交特性的优雅IDR变体》,ACM-Trans。数学。软件,38,1,5:1-5:19(2011)·Zbl 1365.65089号
[11] Sternberg,Shlomo,《动力系统》(2010),多佛出版社·Zbl 1215.37002号
[12] 蒂莫西·戴维斯(Timothy A.Davis)。;胡一凡,佛罗里达大学稀疏矩阵收集,ACM Trans。数学。软件,38,1,1:1-1:25(2011)·Zbl 1365.65123号
[13] Denardo,Eric V.,连通网络的周期和非负矩阵的幂,数学。操作。第2、1、23-24号决议(1977年)·Zbl 0399.15011号
[14] 佩奇,劳伦斯;谢尔盖·布林;拉杰夫·莫特瓦尼;Winograd,Terry,PageRank引文排名:为网络带来秩序,1999年技术报告-66(1999),斯坦福信息实验室
[16] 莫妮卡·比安奇尼;马可·戈里(Marco Gori);Franco Scarselli,Inside PageRank,ACM翻译。互联网技术。,5, 1, 92-128 (2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。