这个Road Runner项目
朝着从大型网站自动提取数据

镜子Roma Tre现场::http://www.dia.uniroma3.it/db/roadRunner网站
大学镜像网站della Basilicata教堂::http://www.difa.unibas.it/roadRunner

描述:

道路跑步者数据库属于大学adi Roma Tre公司和的数据库属于大学adella巴西利卡塔.该项目调查技术通过使用自动生成的包装器。事实上,今天有许多基于Web的应用程序使用包装器从HTML页面中提取数据。这些包装物,然而,通常是手工编码的,因此它们的生成维护困难且劳动密集。要实现自动化包装器生成和数据提取过程Road Runner项目旨在开发原创技术自动生成包装器。

A类包装器生成系统已在一个工作原型,已用于进行多项实验在现实生活中的数据密集型网站上。这些实验证实方法的可行性和。系统原型具有已在中实施Java语言.

在线资源:

出版物
相关论文、技术报告和未发表的手稿项目;
实验结果
自动生成的一些包装器通过我们的系统原型
下载
我们已经在GPL下发布了roadRunner系统的源代码。

 


此页面由维护吉安尼麦加保罗梅里亚尔多
公路跑步者: 地理球菌加利福尼亚州