apache、iis6、ii7规则拦截蜘蛛抓取网页

2021年3月14日14:26:36 评论 1939字阅读6分27秒

apache、iis6、ii7规则拦截蜘蛛抓取网页

如果是正常的搜索引擎蜘蛛访问,不建议对蜘蛛进行禁止,否则网站在百度等搜索引擎中的收录和排名将会丢失,造成客户流失等损失。可以优先考虑升级虚拟主机型号以获得更多的流量或升级为云服务器(不限流量)

更多详情请访问:BaiDuSpider百度蜘蛛占用流量,robots.txt设置

蓝色部分是不明蜘蛛名称,根据需要添加,以|为分割。

Linux下 规则文件.htaccess(手工创建.htaccess文件到站点根目录)

<IfModule mod_rewrite.c>
RewriteEngine On
#Block spider
RewriteCond %{HTTP_USER_AGENT} "Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu" [NC]
RewriteRule !(^robots\.txt$) - [F]
</IfModule>

windows2003下 规则文件httpd.conf(在虚拟主机控制面板中用 “ISAPI筛选器自定义设置 "  开启自定义伪静态 Isapi_Rewite3.1 )

#Block spider
RewriteCond %{HTTP_USER_AGENT} (Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu) [NC]
RewriteRule !(^/robots.txt$) - [F]

windows2008下 web.config

<?xml version="1.0" encoding="UTF-8"?>
<configuration>
<system.webServer>
<rewrite>
<rules>
<rule name="Block spider">
      <match url="(^robots.txt$)" ignoreCase="false" negate="true" />
      <conditions>
        <add input="{HTTP_USER_AGENT}" pattern="Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|curl|perl|Python|Wget|Xenu|ZmEu" ignoreCase="true" />
      </conditions>
      <action type="CustomResponse" statusCode="403" statusReason="Forbidden" statusDescription="Forbidden" />
</rule>
</rules>
</rewrite>
</system.webServer>
</configuration>

注:规则中默认屏蔽部分不明蜘蛛,要屏蔽其他蜘蛛按规则添加即可。

附各大蜘蛛名字:
google蜘蛛:googlebot
百度蜘蛛:baiduspider
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
bing蜘蛛:bingbot
altavista蜘蛛:scooter
lycos蜘蛛:lycos_spider_(t-rex)
alltheweb蜘蛛:fast-webcrawler
inktomi蜘蛛:slurp
有道蜘蛛:YodaoBot和OutfoxBot
热土蜘蛛:Adminrtspider
搜狗蜘蛛:sogou spider
SOSO蜘蛛:sosospider
360搜蜘蛛:360spider

继续阅读
  • 文本由 发表于 2021年3月14日14:26:36
  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接
以SEO培训为例查看用户需求 SEO

以SEO培训为例查看用户需求

以SEO培训为例查看用户需求 大家都知道笔者的业务板块有seo培训,对seo培训这个词有长期的观察。用户需求有真实的,也有人为制造的,通过百度需求图谱,可以大致看到那些需求是被人工操作的。 参加seo...
利用Sitemap提交漏洞劫持其它网站排名 SEO

利用Sitemap提交漏洞劫持其它网站排名

利用Sitemap提交漏洞劫持其它网站排名 我个人虽然不建议做黑帽SEO,但了解一些黑帽技术是白帽SEO的必修课。SEO黑帽的常见技术和最新应用至少可以让我们: · 在不能失误的正规网站上避免黑帽的坑...
搬家更换域名及301重定向方法 网站建设

搬家更换域名及301重定向方法

搬家更换域名及301重定向方法 由于各种原因我们可能需要放弃原来的域名,但需要保留原有的数据存在,很多人可能会直接删除原来的域名重新绑定一个新的域名。其实这样的做法是不妥的,毕竟我们之前花费较多的时间...
SEO网站优化工具分享 SEO

SEO网站优化工具分享

SEO网站优化工具分享 一、快排助手:互刷与自刷的点击软件 软件基本特点 因为有浏览窗口,我认真看了几下刷的几个任务,执行的逻辑还是比较简单的: 打开百度/搜狗/360——输入关键词——鼠标随机下滑—...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: