屏蔽SemrushBot等国外垃圾营销蜘蛛

屏蔽SemrushBot等国外垃圾营销蜘蛛

最近做了一个搜索记录功能,用于搜集用户的喜好,结果发现经常有莫名其妙的搜索记录,每天大概有1000多次的搜索量,WordPress自带的搜索非常耗资源,打开网站日志发现,发现很来自国外的垃圾营销蜘蛛SemrushBot的搜索,在宝塔防火墙中屏蔽IP也无效,网上找了一下,现成的代码:

#禁止垃圾蜘蛛抓取
if ($http_user_agent ~* (SemrushBot|python|Linespider|crawler|DingTalkBot|simplecrawler|ZoominfoBot|zoombot|Neevabot|coccocbot|Facebot|YandexBot|Adsbot|DotBot|Applebot|DataForSeoBot|MJ12bot|BLEXBot|trendictionbot0|trendictionbot|AhrefsBot|hubspot|opensiteexplorer|leiki|webmeup)) { return 444;}

以宝塔为例,将上代码加到站点配置文件,最后一个 } 前面。

当这些垃圾蜘蛛访问网站,只能得到444 没有任何数据。

再加个当链接中包含/search/重定向到其它页面。

代码添加到主题函数模板中:

// 当URL包含 /search/重定向
add_action('template_redirect', 'custom_search_redirect');
function custom_search_redirect() {
    // 获取当前请求的URL
    $request_url = $_SERVER['REQUEST_URI'];    
    // 检查当前URL是否包含 /search/
    if (strpos($request_url, '/search/') !== false) {
        // 如果是,则进行重定向到其他页面
        wp_redirect('https://www.pcppp.com/');
        //wp_redirect(home_url('/new-page/'), 301);
        exit();
    }
}

观察一段再说吧,估计还是不能完全拦截。

2024年4月27日补充,最佳设置方案:

声明:本站所有信息内容均由用户自行发表,该内容观点仅代表用户本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。Email:tellusa@foxmail.com

给TA打赏
共{{data.count}}人
人已打赏
WordPress

“图像后期处理失败。可能服务器忙或没有足够的资源。请尝试上传较小的文件。推荐的最大尺寸为2500像素。”错误的解决方法

2024-4-25 6:07:27

网站优化

收录与索引是什么意思?收录和索引的区别是什么?

2024-4-27 1:45:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
有新私信 私信列表
搜索