3种网站被镜像、采集的最佳解决方法

今天上网发现搜索引擎中出现了一个和自己网站一模一样的网站,自己发了一篇文章,他就能自动跟进采集,并且文章排名比自己的还高,排在我网站的前面,这是网站被恶意镜像了。什么是网站镜像?网站镜像,就是复制整个网站。

网站被镜像怎么办,网站被镜像的3种解决方法

今天上网发现搜索引擎中出现了一个和自己网站一模一样的网站,自己发了一篇文章,他就能自动跟进采集,并且文章排名比自己的还高,排在我网站的前面,FUCK啊,这是网站被恶意镜像了。

什么是网站镜像?

网站镜像,就是通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为,这也是为什么有的网站注明禁止未授权不得做网站镜像的原因了,两个网站的内容完全一样,相似度过高必然会导致自己的网站受到影响。

网站镜像就是网站的复制版本。

如果是别人把自己的站原样做一份放在网上,网站的主人肯定是不能容忍的,可以用搜索引擎找到这样的站, 现在这样搞的人已经比较少了,以前我们经常会发现有人这样照抄别人的网站。所以,那时候很多网站都加了一句严禁建立镜像。

网站被镜像的3种解决方法

方法1:找到镜像网站的主机Ip,通过禁止Ip来解决

具体方法,大家百度解决,不多说。注意ping 域名的话不一定是真实IP,现在很多网站都隐藏真实IP了。

找到镜像网站的IP后,就可以禁止IP来阻止镜像网站复制你的站点了。这招对采集站也有效哦!

在网站主机提供商的网站后台控制面板里有设置IP访问黑名单,如果没有请联系服务器提供商。

如果你是wordpress站点,也可在.htaccess文件里添加如下代码:

#添加IP黑名单
Order Deny,Allow
Deny from 162.158.72.179

这个时候你再刷新一下镜像站点,是不是已经403报错了呢?

此方法的缺点就是如果镜像网站更换了ip,那我们的屏蔽就失败了

方法2:在<head></head>中加入JS来防护

<script type=”text/javascript”>
if (document.location.host != www.125jz.com) {
location.href = location.href.replace(document.location.host,’www.125jz.com’);
}
</script>

或加上以下的JS代码

<script type=”text/javascript”>
rthost = window.location.host;
if (rthost != “www.125jz.com”) {
top.location.href = “http://www.125jz.com”;
}
</script>

将上面代码中的www.125jz.com 改为你网站的首页主地址,如果上面填写的不是网站的主地址 www.125jz.com,而是 mobile521.com的话,就会导致网站一直刷新!

注:经过本站测试,如果镜像站屏蔽了JS,则该方法失效。所以,最好把方法2和方法3结合使用!

方法3:Js被屏蔽后防止镜像的方法

将以下代码加到网站的header.php中

<div style=”display:none;”>
<script>proxy2025 = false;</script>
<img src=”” onerror=’setTimeout(function(){if(typeof(proxy2025)==”undefined”){window.location.host=”www.125jz.com”;}},3000);’>
</div>

 <script>proxy2025 = false;</script>

img的onerror设置超时时间3000毫秒,将运行函数部分,检测是否还存在proxy2025字符,如果没有找到就会将主机的URL改为www.125jz.com

经过测试,此代码在Chrome、IE11和360极速浏览器上均有效,会跳转到源站的原文章页!在Firefox上则无效果,镜像的文章页并不会跳转到原站…… 将代码中img标签的src引用地址改为空格或无效的图片地址后,在Firefox上也起作用了!

WordPress适用版

将下面的代码贴到 functions.php 中的最后一个 ?>之前即可:

/**
* 网站被恶意镜像怎么办
*/
//防止恶意HTTP_USER_AGENT采集
add_action('wp_head', 'lxtx_deny_mirrored_request', 0);
function lxtx_deny_mirrored_request()
{
$ua = $_SERVER['HTTP_USER_AGENT'];
$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP');
if(!$ua) {
header("Content-type: text/html; charset=utf-8");
wp_die('请勿采集本站,采集者木有小JJ!请正常访问,并认准【125建站网】官方网址!');
}else{
    foreach($now_ua as $value )
    if(eregi($value,$ua)) {
    header("Content-type: text/html; charset=utf-8");
    wp_die('请勿采集本站,采集者木有小JJ!请正常访问,并认准【125建站网】官方网址!');
    }
}
}

经过测试,在functions.php中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,采集者木有小JJ!请正常访问,并认准【125建站网】官方网址!”

另为保护JS安全,使用JS方法禁止网站被镜像的站长,在编写好JS代码后,最好使用站长网的JS代码混淆工具后,再放到网站上。

3种网站被镜像、采集的最佳解决方法

125jz网原创文章。发布者:江山如画,转载请注明出处:http://www.125jz.com/11800.html

(0)
江山如画的头像江山如画管理团队
上一篇 2023年3月9日 下午7:12
下一篇 2023年3月12日 上午9:32

99%的人还看了以下文章

  • 站长须知:关于网站收录的五个重大问题

    网站发布的文章最后是需要被搜索引擎收录才能够被用户们搜索到,那么,已经收录的文章消失了是怎么回事?收录后的文章可以修改吗?百度如何对待非原创内容?对于网站收录方面,存在着太多的问题,但是更多的站长往往找不到问题的根源。本文是针对于网站收录问题的一些汇总,希望可以帮助更多的站长解惑。 一、已经收录的文章消失   相信不少站长都发现过一个问题,网站文章收录的飞快…

    2022年8月13日
    8620
  • 如何选购国外虚拟主机?

    国外虚拟主机最大特点就是空间经济便宜,国内的虚拟主机价格比国外的高几倍左右。 国外虚拟主机价格为什么那么便宜呢? 原因就是他们采用大规模工业化生产, 产品数量,每增加一倍,成本就下降31%。同理,在虚拟主机网站空间工业领域,虚拟主机服务商客户越多,而管理根本并没有增加。因此, 价格就可以尽量的低价便宜来满足消费者。 国内虚拟主机价格比国外的高的原因:国内市场…

    2022年8月12日
    9150
  • 一个网站空间绑定2个域名的301重定向死循环解决方法

    一个网站空间绑定2个域名,为什么要重定向? 请查看:301重定向解决双域名权重分散 要实现301重定向方法很多: 1、在mod_rewrite模式下可以新建.htaccess文件,如以下为将125jz.com重定向到www.125jz.com的例子代码: RewriteEngine On RewriteCond %{HTTP_HOST} ^125jz.com…

    2020年12月27日
    1.7K0
  • 6条站长必知的网站代码优化知识

    网站内容是网站核心,在内容质量已定的前提下,优化网站代码则是SEO需要做的基础工作,如果不会优化,必然会影响网站的排名。中国网页设计给大家分享网站代码优化的6条基础知识,希望对各位网页制作初学者有所帮助。 1.alt标签优化 由于搜索引擎不能识别网站的图片,所以图片一定要添加alt标签来描述,告诉搜索引擎,图片不必要又添加alt,又要添加title标签,只要…

    2018年3月18日
    2.4K0
  • 网站优化工具的完整详细的seo优化方案

    在网站关键词的选择的时候首先是需要去分析一下用户的是是需求,可以去分析哪一些词的排名情况会是比较好的,这样就会知道哪一些词是用户会比较关注的。 许多的公司在网站搭建的一个初期,没有专业的一个seo人员,那seo优势网站推广的一个地基,小编在这里与大家分享seo方案。 一、分析seo关键词 在网站建站的第一步的时候就是要做关键词去分析,我们是要去根据自己的额一…

    2022年8月9日
    1.0K0
  • 如何提高搜索引擎蜘蛛的爬行次数,增加网站收录?

    新站前期优化最重要的还是吸引蜘蛛的爬行,网站来访的搜索引擎蜘蛛越多,网站内容的抓取频率也会越多,你的网站内容的收录量也会大大提升,进而影响到网站的收录和排名。就像曾经的一名seo优化讲师所说的,一般新站都需要经历三个发展过程,一是没有收录。二是有收录,没有排名。三是有收录,有排名。作为新站,前期还是以做好网站收录为重要指标。 如何增加搜索引擎蜘蛛的爬行次数,…

    2018年12月26日
    2.5K0

发表回复

登录后才能评论