跑路者

ROADRUNNER系统中的web信息自动提取Road Runner是罗马大学数据库组和Basilicata大学数据库组的联合项目。该项目研究通过使用自动生成的包装器从HTML站点提取数据的技术。事实上,现在许多基于Web的应用程序都使用包装器从HTML页面提取数据。然而,这些包装器通常是手工编码的,因此它们的生成和维护非常困难,而且需要大量的人力。为了自动生成包装器和数据提取过程,Road Runner项目旨在开发自动生成包装器的原始技术。在一个工作原型中实现了一个包装器生成系统,并在实际的数据密集型网站上进行了大量的实验。实验验证了该方法的可行性。系统原型用Java语言实现。


zbMATH中的参考文献(参考 22篇文章,1标准件)

显示第1到第20个结果,共22个。
按年份排序(引用)
  1. Christine Gfrerer;Vajteršic,Marián;Kutil,Rade:在web数据抽取环境中对齐多个字符串的并行算法(2017)
  2. Han,Wook Shin;Kwak,Wooseong;Yu,Hwanjo;Lee,Jeong-Hoon;Kim,Min-Soo:利用空间连接从网页中提取强大的元组(2014)ioport公司
  3. Fazzinga,Bettina;Flesca,Sergio;Tagarelli,Andrea:基于模式的Web包装(2011)ioport公司
  4. 刘伟;阎华亮;肖建国:从论坛站点自动提取用户评论(2011)ioport公司
  5. Nachouki,Gilles;Quafafou,Mohamed:基于语义查询的MashUp web数据源和服务(2011)ioport公司
  6. Álvarez,Manuel;Pan,Alberto;Raposo,Juan;Bellas,Fernando;Cacheda,Fidel:从网页中查找和提取数据记录(2010)ioport公司
  7. 李青;陈静;吴亦普:通过挖掘严格模式提取松散结构数据记录的算法(2009)ioport公司
  8. Michelson,M.;Knoblock,C.A.:从非结构化和非语法数据源创建关系数据(2008)
  9. Mukherjee,Saikat;Ramakrishnan,I.V.:原理图数据的自动语义分析(2008)ioport公司
  10. 王德林;林伟:学习从多个拍卖网站中提取和总结热门物品特征(2008)ioport公司
  11. 朱军;聂再青;张波;文、季荣:集成web数据抽取的动态分层马尔可夫随机场(2008)
  12. Barbançon,Francois;Miranker,Daniel P.:SPHINX:Schema integration by example(2007年)ioport公司
  13. 翟艳红;刘兵:基于实例学习的Web数据抽取(2007)ioport公司
  14. 邓,徐斌;朱,杨勇:L-树匹配:一种新的带噪文本流数据抽取模型与算法(2005)ioport公司
  15. 李昭;吴伟强;孙爱新:基于结构相似性的网络数据抽取(2005)ioport公司
  16. Tijerino,Yuri A.;Embley,David W.;Lonsdale,Deryle W.;Ding,Yihong;Nagy,George:从表到本体生成(2005)ioport公司
  17. Crescenzi,Valter;Mecca,Giansalvatore:大型网站的自动信息提取(2004)
  18. Klusch,Matthias;Bergamaschi,Sonia;Petta,Paolo:智能信息代理的欧洲研发:AgentLink透视(2003)
  19. 马蒂斯.内林;夏尔.马库斯;舒曼,马丁:WrapIt:具有扩展重叠的web数据库的自动集成(2003)
  20. Agarwal,P.K.;Bhattacharya,B.K.;Sen,S.:点均匀划分的改进算法(2002)

更多出版物请访问:http://www.dia.uniroma3.it/db/roadRunner/publications.html