鏡像網站指的是別人將你的網站數據進行的同步,網站的界面及內容基本上都和你的網站保持一致,如果不是兩個網站的主域不同站長自己都會認為是一個網站,兩個網站之間就像鏡子成像一樣因此稱為鏡像網站。
鏡像網站本身是沒有多大危害的,比如一些知名度較高的站點通過設置鏡像網站,用于預防網絡故障保證用戶的正常訪問體驗。但對于中小網站的SEO(依賴搜搜引擎獲取流量)而言卻有著不小的影響,那么如何及時發(fā)現網站被鏡像呢?遇到網站鏡像又該如何處理?
自己設置網站鏡像是為了應對突發(fā)網絡故障的一種策略,但在不知道的情況下被鏡像大都是不懷好意的。要么是同行惡意競爭對你的網站進行負面SEO,要么為了利用你的網站內容獲得排名,然后把用戶轉向到非法的內容網站,僅僅是為了不讓域名閑置而鏡像的網站基本不存在。
1、采集站和鏡像站的區(qū)別
上邊提到鏡像網站是為了利用網站內容快速獲得排名,因此有人認為鏡像指的是采集,雖然從利用網站內容的目的來看兩者是相同的,但采集站與鏡像站在技術手段以及展現形式上還是有區(qū)別的。
采集站一般是提前將網站內容抓取,然后發(fā)布在自己網站程序進行內容發(fā)布。當被采集站更新內容之后,采集站需要重新采集并進行發(fā)布。但鏡像網站并不需要提前抓取被鏡像站內容,而是在用戶訪問時實時從被鏡像的網站調取內容,期間會進行一些URL替換或者文字修改及添加js的操作。也就是說鏡像網站在遇到目標站點更新時,不需要進行重新采集操作,就能保證網站的內容同步。
2、被鏡像網站SEO有什么影響
那么鏡像網站對被鏡像網站SEO的影響,主要在于其他網站擁有和你的網站重復的內容,對不太完善的原創(chuàng)分析算法而言,很有可能將鏡像網站當做優(yōu)質站點給予排名,而對被鏡像站點進行懲罰或者限制。因此對中小站點來說,在被別人不懷好意的鏡像之后,很有可能影響到搜索引擎端的流量占比。
雖然對于高權重網站而言,不會被鏡像站點搶奪搜索端流量,但卻很可能造成網站用戶分不清哪個是李逵哪個是李鬼,或者把用戶引流到灰色行業(yè)網站造成品牌形象受損。
3、如何及時發(fā)現網站被鏡像
一般網站都添加了統(tǒng)計工具,因此可以通過分析相關數據發(fā)現受訪域名異常,但現在的網站鏡像工具很容易替換或者刪除統(tǒng)計代碼,因此這種方法并不能發(fā)現所有的鏡像網站。因此站長可通過搜索網頁中的特征句,比如網站品牌詞或者首頁標題等,但考慮到這類詞被替換的可能性很大,更建議選擇頁面中的品牌廣告語,而非文章內容中的句子(大都為采集站)。雖然沒有一種方法可以做到查無遺漏,但是可以嘗試多種方法進行檢測,以便能及時發(fā)現網站是否被鏡像。
4、網站被鏡像后如何處理
網上可以看到不少網站被鏡像的處理方法,但由于內容比較久遠且鏡像工具的更新升級,很多方法已經無法做到有效處理了。比如將網頁中的鏈接改為絕對地址,然而面對可以自動替換網站的鏡像工具,無論是絕對地址還是相對地址沒啥差別。
網站被鏡像后的處理原則就是,阻止鏡像站點對網站內容進行同步??梢钥紤]添加JS代碼檢測頁面是否在自己的域名下受訪,這樣自己的網站可正常顯示內容,而非自己域名(鏡像網站)被訪問時強迫跳轉回自己的網站。這樣雖然能挽回用戶體驗,但搜索引擎并不會執(zhí)行該JS代碼,還是會抓取鏡像站點內容。
最有效的處理辦法就是對鏡像網站的來訪IP進行屏蔽,通過服務器端設置IP黑名單阻斷對網站的實時同步。但需要注意的是用來抓取的IP可能不是域名IP而是CDN或者虛擬IP,因此需要通過查看分析網站日志篩選可疑IP。熟悉程序的站長可以編寫腳本放到自己的網站根目錄中,該腳本的功能用于顯示IP,切換到鏡像站域名訪問該腳本即可得到鏡像站IP。
溫馨提醒:
發(fā)現鏡像網站除過阻止其對網站的實時同步之外,還可以向搜索引擎提交問題,或者向域名注冊商以及主機服務商投訴。優(yōu)秀的SEOer不僅需要熟悉搜索引擎算法,以及常規(guī)的SEO操作,同時還需要涉及網站安全以及數據統(tǒng)計網站日志的分析,不斷提升對網站及搜索引擎的認識。
同樣是做SEO,對于SEO思維和實操,不同的SEOer都有自己的見解與心得,歡迎每一位喜歡SEO的朋友留言交流?。?!