亚洲国产第一_开心网五月色综合亚洲_日本一级特黄特色大片免费观看_久久久久久久久久免观看

Hello! 歡迎來到小浪云!


云服務(wù)器Apache利用USER_AGENT屏蔽惡意蜘蛛


 

最近發(fā)現(xiàn)日志里有很多沒見過的蜘蛛U(xiǎn)A,基本上都是國外的一些搜索引擎,或者很本不是搜索引擎,有的抓取頻率很高,剛開始設(shè)置了下robots.txt,因?yàn)樗麄兪紫榷甲ト×藃obots.txt,應(yīng)該是遵守規(guī)則的,沒想到人家只是走個(gè)過場,并沒有把robot.txt放在眼里。

 

apache可以用.htaccess文件來通過useragent來屏蔽一些訪問,搜了一下,大概可以這么做:

 

 

 

 

.htaccess

SetEnvifNoCase?User-Agent?^.*Scrapy.*?bad_bot

SetEnvifNoCase?User-Agent?^.*SemrushBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*ExtLinksBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*YandexBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*MauiBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*Python.*?bad_bot

SetEnvifNoCase?User-Agent?^.*NetcraftSurveyAgent.*?bad_bot

Deny?from?env=bad_bot

這樣當(dāng)這些匹配的useragent就會(huì)被返回403禁止訪問。

 

可是第二天發(fā)現(xiàn)有幾個(gè)useragent瘋狂的訪問robot.txt,反正都不遵守規(guī)則,那么執(zhí)著的訪問robots.txt干什么。。。。。

 

于是我換了一種方法,打算用302(301也一樣啦,對(duì)這些惡意蜘蛛沒那么講究)把他們轉(zhuǎn)走。

 

.htaccess

云服務(wù)器Apache利用USER_AGENT屏蔽惡意蜘蛛

這樣,就都被302到www.xlyVPS.com了,現(xiàn)在再看那些未知的蜘蛛基本不會(huì)在主站亂爬了。

 

另:.htaccess的正則:”^”代表字符串的開始,”.*”代表任意字符。

 

NC代表不區(qū)分大小寫,OR代表或者,L的意思是一旦有符合條件的規(guī)則就不再執(zhí)行下面的規(guī)則,所以這些語句要放在wordpress等程序默認(rèn)偽靜態(tài)規(guī)則的前面。

相關(guān)閱讀