为坏机器人添加你自己的虚拟黑洞陷阱。
再见,坏机器人。。
坏机器人是最坏的。他们做各种肮脏的事情,浪费服务器资源。黑洞插件有助于阻止坏机器人,并为合法访问者节省宝贵资源。
它是如何工作的?
首先,插件在页面的页脚添加了一个隐藏的触发器链接。然后在robots.txt文件中添加一行,禁止所有机器人跟踪隐藏的链接。然后,无视或违反机器人规则的机器人会爬过链接,落入陷阱。一旦被困,坏机器人将被拒绝进一步访问WordPress网站。
我称之为“一站式”规则:机器人有一次机会遵守你网站的robots.txt规则。不遵守规则会立即被驱逐。最棒的是黑洞只影响坏机器人:人类用户永远看不到隐藏的链接,好机器人首先遵守机器人规则。Win-Win!🙂
使用缓存插件?查看安装注意事项获取重要信息。
特征
- 易于设置
- 吱吱作响的干净代码
- 聚焦和模块化
- 轻便、快速、灵活
- 使用WordPress API构建
- 与其他安全插件配合使用
- 易于重置坏机器人列表
- 易于从列表中删除任何机器人
- 定期更新并“经得起未来考验”
- 黑洞链接包含“nofollow”属性
- 可通过设置屏幕配置插件选项
- 在幕后默默工作以保护您的网站
- 白名单所有主要搜索引擎永远不会阻止
- 注重灵活性、性能和安全性
- 通过WHOIS查找阻止的机器人程序发送电子邮件警报
- 通过“帮助”选项卡完成内联文档
- 提供将任何IP地址列入白名单的设置
- 自定义显示给坏机器人的消息😉
- 一键恢复插件默认选项
- 不使用或不需要任何.htaccess规则
Blackhole for Bad Bots保护您的站点免受坏机器人、垃圾邮件发送者、刮板、扫描仪和其他自动威胁的攻击。
不使用WordPress?查看Blackhole的独立PHP版本!
结账黑洞专业版并使用高级功能升级!
白名单
默认情况下,此插件不会阻止任何主要搜索引擎(用户代理):
- 美国在线服务公司
- 百度
- Bingbot/MSN公司
- 鸭子鸭子走
- 爬虫
- 特奥马
- 雅虎!
- Yandex公司
这些搜索引擎(及其各种变体)通过用户代理被列入白名单。还有许多其他“有用”的机器人程序。它们始终可以完全访问您的站点,即使违反了robots.txt规则。可以在插件设置中自定义此列表。有关白名单机器人程序的完整列表,请访问插件设置中的“帮助”选项卡(在“白名单设置”下)。
隐私
用户数据:这个插件会自动阻止坏机器人。当坏机器人落入陷阱时,其IP地址、用户代理和其他请求数据存储在WP数据库中。此插件未收集其他用户数据。管理员可以随时通过插件设置删除所有保存的数据。
服务:此插件不连接到任何第三方位置或服务。
曲奇饼干:此插件不设置任何cookie。
学分:标题图片由NASA/JPL-Caltech提供。
坏机器人黑洞由开发和维护杰夫·斯塔尔,15年WordPress开发人员和书籍作者.
支持开发
我为WordPress社区开发并维护了这个免费插件。为了表示支持,您可以捐款或购买我的一本书:
和/或购买我的一个高级WordPress插件:
链接、推文和赞也很受欢迎。谢谢您!🙂
为坏机器人安装黑洞
- 将黑洞插件上传到你的博客并激活
- 访问黑洞设置并复制机器人规则
- 将Robots规则添加到站点的Robots.txt文件中(请参阅备注)*
- 根据需要和完成配置黑洞设置
注:对于robots.txt规则,有两种情况:
- 您的站点有一个可以在服务器上看到的物理robots.txt文件。在这种情况下,您需要手动添加所需的规则。
- 或者,您的站点正在使用动态/虚拟WP生成的robots.txt文件,并且您的服务器上没有物理robots.txt文件。在这种情况下,插件会自动添加所需的规则。您不需要手动添加任何内容。
有关完整的文档,请单击黑洞设置屏幕右上角的“帮助”选项卡。“坏机器人”屏幕上也提供了帮助选项卡。
有关安装WP插件的更多信息
验证黑洞是否正常工作
使用缓存插件?查看以下名为“缓存插件”的部分,了解重要信息。
缓存插件
Blackhole适用于除“页面缓存”之外的任何类型的缓存。它还与页面缓存插件/脚本不兼容。因此,如果您的网站使用任何类型的页面缓存,请不要使用此插件。谢谢!
更多细节:有很多类型的缓存插件。它们提供各种不同的缓存机制和功能。除了“页面缓存”之外,所有缓存功能都适用于Blackhole。使用页面缓存时,所需的WP初始化
hook可能不会被触发,这意味着像Blackhole这样的插件无法动态记录和禁止请求。幸运的是,一些最流行的缓存插件提供了与Blackhole完全兼容的设置。有关完整列表,请查看这篇文章注意:这篇文章是为黑洞专业版,但兼容性列表和一般信息也适用于Blackhole(免费版本)。
没有robots.txt?
对于robots.txt文件,有两种可能的情况:
- 您希望使用自己的物理robots.txt文件,可以在服务器上查看和编辑该文件。在这种情况下,请按照以下步骤创建站点的robots.txt文件。
- 或者,您希望使用动态/虚拟WP生成的robots.txt文件,这样服务器上就没有物理robots.txt文件。在这种情况下,您不需要做任何事情,因为WordPress会在请求时自动生成robots.txt文件。
如果使用选项#1,以下是为站点创建robots.txt文件的步骤:
- 将空白纯文本文件添加到站点的根目录
- 命名文本文件
robots.txt(机器人.txt)
并上传到服务器
完成。现在您可以添加插件设置页面上提供的黑洞规则。请参阅下一节了解更多信息并验证robots.txt文件。
要查看robots.txt文件,请访问以下URL(将example.com替换为您的域):
https://example.com/robots.txt
提示:您可以在插件设置页面上找到站点robots.txt文件的链接。
机器人工具和信息
下面是一些收集的用于使用robots.txt的资源。有关更多工具,请参阅下一节“Testing Robots.txt”。
网上有很多很棒的资源,可以了解和验证robots.txt文件。阅读吧,这对SEO很重要。
测试机器人.txt
要测试您网站的robots.txt规则是否正确,您可以使用免费的robots.txt检查器。谷歌提供了机器人检查器在您的谷歌账户内(即必须登录谷歌)。网上还有很多其他的机器人验证器。以下是一些示例:
网上有更多的机器人工具,只需搜索“validate robots.txt”(不带引号)之类的内容即可了解更多。
测试黑洞
要测试黑洞陷阱是否有效,首先从插件设置“白名单IP”中删除您的IP地址。还要确保您的浏览器不包含在插件设置“白名单机器人”中(例如,Chrome被列入白名单).OR而不是更改任何插件设置,您可以使用代理服务和非白名单浏览器(例如Brave或Opera)执行测试。
删除IP地址和用户代理(或使用代理服务)后,请查看站点上任何网页的源代码。在页面页脚附近向下滚动,直到找到与以下内容类似的链接:
<a rel=“nofollow”style=“display:none”href=“https://example.com/?blackhole=1234567890“title=”请勿点击此链接,否则您将被禁止访问网站!“>您的网站名称</a>
单击链接(href公司
value)查看警告消息。访问警告消息后,刷新页面以查看拒绝访问消息。和/或访问站点前端的任何其他页面,以验证您是否已被禁止。但别担心,你永远不会被禁止进入WP管理区或WP登录页面。因此,只需登录并从Bad Bots列表中删除您的IP地址即可恢复前端访问。
有关的更多信息如何验证黑洞正在工作»
为什么没有机器人?
如果您没有看到任何坏的机器人程序被阻止,请记住以下几点:
- 确保您已根据上述文档进行了设置
- 新(er)网站可能不会收到大量不良的机器人程序流量
- 流量低的网站可能不会有太多坏的机器人程序
- 检查您是否正在使用其他僵尸插件
- 并非所有的网站(甚至是热门网站)都有大量的机器人程序
- 如果站点上有页面缓存,黑洞将不起作用
- 如果有疑问,可以测试插件是否工作(请参阅上面的前一节)
所以记住这些事情。在大多数情况下,一些坏机器人掉入黑洞只是时间问题。
还要注意,该插件提供了两个“白名单”设置:
默认情况下,当插件被激活时,某些东西会自动白名单。例如,您的IP地址被添加到白名单IP设置中。此外,Chrome和其他用户代理也被添加到白名单用户代理设置中。测试插件功能时请记住。
白名单机器人
Blackhole for Bad Bots经过严格测试,确保顶级搜索引擎机器人永远不会被屏蔽。任何报告包含以下任何字符串的用户代理的机器人程序都将始终可以访问您的站点,即使它们违反了robots.txt。
a6索引器、adsbot-google、ahrefsbot、aolbuild、api-谷歌、百度、bingbot、bingpreview、蝴蝶、cloudflare、chrome、duckducko、embeddly、facebookexternalhit、facebot、谷歌页面速度、googlebot、ia_archiver、linkedinbot、mediapartners-谷歌、msnbot、netcraftsurvey、outbrain、pinterest、quora、rogerbot、showyoubot、slackbot、swurp、sogou,teoma、tweetmemebot、twitterbot、uptimerobot、urlresolver、vkshare、w3c验证器、wordpress、wp火箭、yandex
当然,这个列表可以通过插件设置完全自定义。每个添加的字符串都与完整的用户代理相匹配,因此要小心。了解有关的更多信息顶级搜索引擎的用户代理.
您还可以按IP地址将机器人程序列入白名单。访问“白名单IP”设置,并输入IP地址(用逗号分隔多个IP)。您也可以将整个IP范围列入白名单。在同一插件设置中,添加如下内容:
123.456.
这将允许所有机器人程序报告以开始的任何IP123.456.
。您还可以使用CIDR标记将IP地址列入白名单。有关详细信息,请查看插件设置页面上的帮助选项卡。
自定义
黑洞提供了大量用于定制和扩展的挂钩:
黑洞选项(_O)黑洞_机器人黑洞获取选项黑洞getbadbots黑洞日志数据黑洞_触发器黑洞变种黑洞日志黑洞_按键黑洞警报名称黑洞警报主题黑洞警报消息黑洞警报头黑洞针黑洞_消息_错误黑洞消息自定义黑洞_消息_无黑洞_ignore_loggedin黑洞_ignore_backend黑洞忽略登录黑洞锁定状态黑洞块协议黑洞块连接黑洞_过滤器黑洞验证日志黑洞设置上下文帮助黑洞badbots_contextual_help
如果需要添加挂钩,给我写封信,将很高兴将其连接起来😉
自定义警告模板
黑洞显示两种类型的信息:
- 警告消息–当机器人程序遵循黑洞触发时显示
- 阻止的消息–显示被阻止机器人发出的所有请求
可以通过插件设置自定义阻止消息。可以通过设置自定义模板自定义警告消息:
- 复制
黑洞模板.php
从插件的/公司/
目录
- 将文件粘贴到主题模板中,例如:
/wp-content/my-awesome-theme/blackhole-template.php
- 自定义“开始模板”和“结束模板”之间的任何标记
- 上传到服务器并完成
如果主题目录中存在自定义模板,插件将自动使用它来显示警告消息。如果主题目录中不存在自定义模板,插件将返回默认警告消息。
提示:您可以通过/wp含量/
目录,如:/wp-content/黑洞/黑洞模板.php
专业版中提供了更多选项»
正在卸载
坏机器人黑洞会自动清理。当通过插件屏幕卸载插件时,所有插件设置和坏的机器人程序列表将从数据库中删除。卸载后,不要忘记从您的robots.txt(机器人.txt)
文件。把它们放在适当的位置是可以的,这不会伤害任何东西,但如果没有安装插件,它们就没有任何用处。
更具体地说,Blackhole只向数据库添加了两件事:选项和bot列表。当通过插件屏幕卸载/删除插件时,这两项都会通过中的以下行自动删除卸载.php
:
删除选项('bb_options');删除选项('bbb_badbots');
因此,在卸载插件并删除robots.txt规则后,您的站点上将不会有坏机器人黑洞的踪迹。
喜欢这个插件吗?
如果您喜欢Blackhole for Bad Bots,请花点时间给予五星评级。这有助于保持发展和支持走强。谢谢您!