{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期部分”:[2022,4,3]],“日期时间”:“2022-04-03T15:10:58Z”,“时间戳”:1648998658199},“发布者位置”:“新加坡”,“引用计数”:14,“发布商”:“Springer Singapore”,“isbn-type”:[{“值”:“9789811020971”,“类型”:”print“},{“值”:“9789811020988”,“类型”:“electronic”}],“license”:[{“start”:{“date-parts”:[[2016,1,1]],“date-time”:“2016-01-01T00:00:00Z”,“timestamp”:1451606400000},“content-version”:“unspecified”,“delay-in-days”:0,“URL”:“http:\\/www.springer.com\/tdm”}]published-print“:{”date-parts“:[2016]]},“DOI”:“10.1007\/978-981-10-2098-8_26”,“type”:“书籍章节”,“已创建”:{“日期部分”:[[2016,7,30],“日期时间”:“2016-07-30T02:56:57Z”,“时间戳”:1469847417000},“page”:“217-225”,“source”:“Crossref”,“由count引用”:0,“title”:[“BBC新闻猎人:BBC新闻的小说爬行器”],“prefix”:“10.1007”,“author”:[{“given”:“Mingxin”,“家庭”:“王”,“sequence”:“first”,“affiliation”:[]},{“given”:“Ning”,“family”:“Wang”,”sequence“:”additional“,”affiliance“:[]neneneep,{”given“:”Boran“,”family“:”Wang“,”se序列“:”additional“、”affidiation“:[]},”givent“:”Can“,”从属“:[]},{”给定“:“国忠”,“家族”:“赵”,“序列”:“附加”,“从属关系”:[]},{“给定”:“小松”,“家庭”:“汉”,“顺序”:“额外”,“隶属关系”:[]}],“成员”:“297”,“在线发布”:{“日期部分”:[[2016,7,31]]}:“Wang,J.,Zhu,L.,Li,C.:再次讨论搜索引擎的核心\u2014web crawler。摘自:2011年计算机科学与服务系统国际会议,第3188\u20133191页。IEEE(2011)“,”DOI“:”10.1109\/CSSS.2011.5972036“},{”key“:”26_CR2“,”first page“:“32”,“volume”:“1”,“author”:“R Khare”,“year”:“2004”,“unstructured”:“Khare,R.,Cutting,D.,Sitaker,K.,Rifkin,A.:Nutch:一个灵活且可扩展的开源网络搜索引擎。Or.州立大学1,32(2004)”,“journal-title”:“Or.State Univ.”},“issue”:“18”,“键”:“26_CR3“,”doi-asserted-by“:”crossref“,”first-page“:”3825“,”doi“:”10.1016\/j.comnet.2012.10.007“,”volume“:”56“,”author“:”S Brin“,”year“:”2012“,”unstructured“:”Brin,S.,page,L.:重印:大型超文本网络搜索引擎的剖析。计算。Netw公司。56(18),3825\u20133833(2012)“,“新闻标题”:“计算。Netw公司。“},{”key“:”26_CR4“,”unstructured“:”http://\/blog.csdn.net\/chaishen10000\/article\/details\/50776662“}”,{“key”:“26_CR5”,“unstructure”:“Mohr,G.,Stack,M.,Ranitovic,I.等人:Heritrix简介一个开放源码存档质量的网络爬虫。In:IWAW 2004,第四届国际网络存档研讨会(2004)”},“{”key“:“26-CR6”,“doi-asserted-by“:”crossref“,”unstructured“:”Liu,D.F.,Fan,X.S.:基于heritrix的网络爬虫算法的研究与应用。In:Advanced Materials Research,vol.219,pp.1069\u20131072。Trans-Tech Publications(2011)“,”DOI“:”10.4028\/www.science.net\/AMR.219-220.1069“},{”issue“:”3“,”key“:”26_CR7“,”first page“:“175”,“volume”:“9”,”author“:”HG Kim“,”year“:”2015“unstructured“:”Kim,H.G.,Lee,J.W.,Ban,T.H.,Jung,H.K.:基于分布式爬行的开销优化研究。Int.J.Softw.Eng.Appl.9(3),175\u2013182(2015)”,“期刊标题”:“Int.J.Softw。工程应用。“},{”key“:”26_CR8“,”first-page“:”30“,”volume“:“3”,”author“:”W Feng“,”year“:”2005“,”unstructured“:”Feng,W.,Mao,Z.:基于web的网页信息提取研究。洛阳技术期刊社3,30\u201331(2005)“,”journal-title“:”洛阳技术杂志社“}”,{“key”:“26_CR9”,“doi-asserted-by”:“crossref”,“unstructure”:“”Chakrabarti,S.:将文档对象模型与超链接集成,以增强主题提取和信息提取。摘自:第十届万维网国际会议记录,第211\u2013220页。ACM(2001)“,“DOI”:“10.1145\/371920.372054”},{“key”:“26_CR10”,“DOI-asserted-by”:“crossref”,“unstructured”:“Hengru,Z.,Chun,C.:基于ajax的Web信息提取技术研究。In:2011国际商业计算与全球信息化会议(BCGIN),第208\u2013211页。IEEE(2011)“,”DOI“:”10.1109\/BCGIn.2011.60“},{”key“:”26_CR11“,”DOI-asserted-by“:”crossref“,”unstructured“:”Kovacevic,M.、Diligenti,M.,Gori,M.和Milutinovic,V.:使用视觉信息识别网页中的公共区域:页面分类中的可能应用。参见:2002年IEEE国际数据挖掘会议记录,ICDM 2003,pp.250\u2013257。IEEE(2002)“,”DOI“:”10.1109\/ICDM.2002.1183910“},{“key”:“26_CR12”,“DOI-asserted-by”:“crossref”,“unstructured”:“Kang,J.,Choi,J.:使用可视块分割检测信息网页块以实现高效信息提取。摘自:信息技术融合国际研讨会,ISITC 2007,第306\u2013310页。IEEE(2007)“,”DOI“:”10.1109\/ISITC.2007.6“},{“issue”:“2”,“key”:“26_CR13”,“DOI-asserted-by”:“crossref”,“first page”:”467“,“DOI”:“10.1145\/304181.304223”,”volume“:”28“,”author“:”DW Embley“,”year“:”1999“unstructured”:“Embley,D.W.,Jiang,Y.,Ng,Y.K.:web文档中的记录边界发现。ACM SIGM.OD记录28(2),467\u2013478(1999)。ACM“,”journal-title“:”ACM SIGMOD Rec.“},{”issue“:”3“,”key“:”26_CR14“,”首页“:”144“,”volume“:“24”,”author“:”XX Zhao“,”year“:”2007“,”unstructured“:”Zhao,X.X.,Suo,H.G.,Liu,Y.S.:“基于标记窗口的Web内容信息提取方法。Jisuanji Yingyong Yanjiu\/Appl.Res.Comput.24(3),144\u2013145(2007)“,”journal-title“Jisuanji Yingyong Yanjiu公司。Res.计算。“}],”container-title“:[”Communications in Computer and Information Science“,”Social Computing“],”original-title”:[],“link”:[{“URL”:“http://\/link.springer.com/content\/pdf\/10.1007\/978-981-10-2098-8_26”,“content-type”:“unspecified”,“内容-版本”:“vor”,“intended-application”:“相似性检查”}],“存放”:{“日期-部件”:[2017,6,24]],“date-time“:”2017-06-24T19:33:13Z“,”timestamp“:1498332793000},”score“:1,”resource“:{主要”:{“URL”:“http://\/link.springer.com/10.1007\/978-981-10-2098-8_26”}},“subtitle”:[],“shorttitle”:[],“issued”:{“date-parts”:[2016年]},《ISBN》:[“9789811020971”,“978981 1020988”],“references-”count“:14,”URL“:”http://\/dx.doi.org\/10.1007\/978-981-10-2098-8_26“,”关系“:{},”ISSN“:[”1865-0929“,”1865-0737“],”ISSN-type“:[{”value“:”1865-029“,”type“:”print“},{”value“:“1865-0937”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[2016]}}}