www检查链接
在本文件中:
wwwchecklinks-检查网页是否有断开的链接
www检查链接
[-图像链接
对
|不
][-选中所有链接
对
|不
]根URL1...根URLn个[-修剪
网址1...网址n个]
www检查链接
是一个在中查找断开链接的程序网页层次结构。要检查的层次结构的根是由命令行上给定的一个或多个URL确定。结果显示在X窗口中,其中允许您浏览结果(即使搜索正在进行)。这个结果也可以保存到两个文件中:一个摘要文件(称为检查链接。总结
)和一个完整的已检查文档的交叉引用列表(称为检查链接。报告
).
- [
-图像链接
对
|不
]
对
意味着指向内联图像的链接选中的。这是默认设置。
- [
-选中所有链接
对
|不
]
对
意味着所有链接都是选中的。不
表示仅链接到上的文档将检查与根文档之一相同的服务器。这个默认值为不
.
- [
-修剪
网址1...网址1]
- 通常,根文档下面的所有可访问文档都是选中的。使用此选项可以修剪选定的子层次。
的一些示例用法www检查链接
:
www检查链接网址:http://www.cs.chalmers.se/~哈格伦/
- 程序将检查从我的主页到其他同一服务器上的文档可以工作。它还将遵循指向我的其他文档的链接(即。,URL以开头的文档
网址:http://www.cs.chalmers.se/~哈格伦/
)并检查它们也是。
wwwchecklinks-checkalllinks是网址:http://www.cs.chalmers.se/~哈格伦/
- 如前一示例所示,但程序将检查全部的链接,而不仅仅是指向同一服务器上的文档的链接(例如。,www.cs.chalmers.se)。这可能需要一些时间,因为我bookmarks.html文件包含400多个指向各种服务器的链接全世界。
www检查链接网址:http://www.cs.chalmers.se/~哈格伦/-修剪网址:http://www.cs.chalmers.se/~hallgren/naptv公司
- 在www目录中,我有两个子目录,naptvb94和naptvb95,以及课程相关信息。如果我只想检查我的个人页面我把它们删掉了。程序仍然检查从我的主页到naptvb94中文档的链接naptvb95,但它不会进入naptv目录并检查那里的文档。
当你启动程序时,它开始查找断开的链接和打开如下所示的窗口:
窗口顶部显示结果摘要,即仅当您按下“更新”按钮时才更新。您可以按更新随时查看搜索进度。您也可以按随时使用“保存”按钮保存迄今为止收集的信息。(文件将被调用检查链接。总结
和检查链接。报告
.)
窗口的底部由三个框组成,显示搜索进度。它们从上到下显示:哪个文档正在目前已检查服务器连接状态目前已检查。
搜索完成后(并且您已按下“更新”按钮)窗口将如下所示:
摘要窗口显示在搜索。这些行具有以下通用格式:
引用计数 ->
信息 统一资源定位地址
哪里参考_计数是对此的引用数URL,信息是有关URL或它所指的文件和统一资源定位地址是有问题的URL。搜索期间遇到的URL显示在以下顺序:
- 断开的链接。在这种情况下,信息字段指示尝试获取时发生的错误类型文档。常见错误包括:
找不到BAD 404
.web服务器答复说没有具有给定URL的文档。BAD 301永久移动
.web服务器答复说文档已被移动。最常见的原因是你忘了把/
在URL末尾指目录。您通常不会注意到以下错误普通Web浏览器,因为它们自动使用正确的URL重新发出请求。这会降低速度访问并增加了服务器上的负载。
断开的链接按错误号和编号排序对它们的引用。
- 未选中的链接信息字段说
未选中
.
- 工作链接到已检查的文档. The信息字段指示MIME类型(例如。
文本/html
)文件的编号未选中,破碎的和工作链路在文档中。这个文档按断开链接的数量排序。
- 工作链接到未选中的文档. The信息字段包含文档的MIME类型和
? ? ?
(表示工作/断开的链接未知)。
摘要窗口中显示的列表保存在检查链接。总结
当您按下“保存”按钮时。单击摘要窗口中的行打开一个窗口,其中包含有关该链接/文档的更多详细信息。例如,单击在线
3->text/html 7 1 24网址:http://www.cs.chalmers.se/~哈格伦/
(顺便说一下,我的主页有三处引用在选中的文档中,我的主页包含7个未选中的链接,其中一个断环和24个工作环)在上述窗口中生成以下信息:
文件网址:http://www.cs.chalmers.se/~哈格伦/类型:text/html本文件参考文件来源:网址:http://www.cs.chalmers.se/~hallgren/lic-abstract.html网址:http://www.cs.chalmers.se/~hallgren/videoband.html网址:http://www.cs.chalmers.se/~hallgren/klockan.cgi公司坏链接http://www.cs.chalmers.se/Fudgets网站/未选中的链接http://lips.cs.chalmers.se:8888/trams地鼠://sunic.sunet.se:43/0thomas-h.pp.se公司地鼠://cs.chalmers.se:79/0/w哈尔格伦http://slip-02.cs.chalmers.se/ftp://ftp.cs.chalmers.se/pub/users/hallgren公司http://www.chalmers.se网站/良好的链接网址:http://www.cs.chalmers.se/~hallgren/count.cgi网址:http://www.cs.chalmers.se/~hallgren/klockan.cgi公司网址:http://www.cs.chalmers.se/~hallgren/wget.cgi网址:http://www.cs.chalmers.se/~hallgren/ibtelpre.html
(+其余20个良好链接)
此信息(针对全部的文档)保存在检查链接。报告
当您按下“保存”按钮时。这是1.0版。请注意以下限制:
- 该程序可以处理文档层次结构有效地使用多达数百个文档。性能随着文档数量的增加而降低。检查大型层次结构可能需要很长时间(比如一个小时1000个文档)。如果文件太多,程序可能会用完记忆和死亡。解决方法:而不是在中检查完整的文档层次结构一次运行,在完整的层次结构。修剪掉无趣的下层建筑。
- 该程序仅使用http协议检查链接。ftp、,不检查gopher、telnet、mailto和其他链接。
- 如果HTML解析器失败,来自该文档的链接将静默忽略。
- 该程序使用了大量的内存。
该程序安装在我们位于的本地Sun4计算机上{cs,math,md,mdstud}.chalmers.se
.向作者发送任何问题或评论:托马斯·哈格伦.
托马斯·哈格伦