修改配置nginx,限制无良爬虫频率
By yejr on 13 五月 2013
#全局配置limit_req_zone $anti_spider zone=anti_spider:10m rate=15r/m;#某个server中 limit_req zone=anti_spider burst=30 nodelay; if ($http_user_agent ~* "xxspider|xxbot") { set $anti_spider $http_user_agent;}
超过设置的限定频率,就会给spider一个503。
上述配置详细解释请自行google下,具体的spider/bot名称请自定义。