【seo術(shù)語】什么導(dǎo)致搜索引擎蜘蛛不能順利爬行

1.jpg

  本人在SEO診斷過程中經(jīng)常遇到這樣的問題,有一些網(wǎng)頁,內(nèi)容優(yōu)質(zhì),用戶也可以正常訪問,但是搜索引擎蜘蛛spider卻無法訪問并抓取,造成搜索結(jié)果覆蓋率缺失,對百度搜索引擎對站點(diǎn)都是一種損失。百度把這種情況叫“抓取異?!?,對于大量內(nèi)容無法正常抓取的網(wǎng)站,百度搜索引擎會認(rèn)為網(wǎng)站存在用戶體驗(yàn)上的缺陷,并降低對網(wǎng)站的評價(jià),其在抓取、索引、排序上都會受到一定程度的負(fù)面影響,最終影響到網(wǎng)站從百度獲取的流量。下面,作者總結(jié)了一些常見導(dǎo)致搜索引擎蜘蛛不能順利爬行的異常原因,供大家參考。


  服務(wù)器鏈接異常


  服務(wù)器鏈接異常會有兩種情況:一種是站點(diǎn)不穩(wěn)定,baiduspider嘗試鏈接您網(wǎng)站的服務(wù)器時出現(xiàn)暫時無法鏈接的情況:另一種是baiduspider一直無法鏈接上您網(wǎng)站的服務(wù)器。


  造成服務(wù)器鏈接異常的原因通常是您的網(wǎng)站服務(wù)器過大,超負(fù)荷運(yùn)轉(zhuǎn)。也有可能是您的網(wǎng)站運(yùn)行不正常,請檢查網(wǎng)站的web服務(wù)器是否安裝且正常運(yùn)行,并使用瀏覽器檢查主要頁面能否正常訪問。您的網(wǎng)站和主機(jī)還可能阻止了空間或者購買cdn服務(wù)。


  DNS異常


  當(dāng)baiduspider無法解析您網(wǎng)站的IP時,會出現(xiàn)DNS異常。可能是您的網(wǎng)站IP地址錯誤,或者域名服務(wù)商把baiduspider封禁。請使用WHOIS或者h(yuǎn)ost查詢自己網(wǎng)站IP地址是否正確且可解析,如果不正確或無法解析,請與域名注冊商聯(lián)系,更新你的IP地址。


  IP封禁


  IP封禁為:限制網(wǎng)絡(luò)的出口IP地址,禁止該IP段的使用者進(jìn)行內(nèi)容訪問,在這里特指封禁了baiduspiderIP。當(dāng)您的網(wǎng)站不希望baiduspider訪問時,才需要該設(shè)置。如果您希望baiduspiderIP。也有可能是您網(wǎng)站所在的空間服務(wù)商把百度IP進(jìn)行了封禁,這時您需要聯(lián)系服務(wù)商更改設(shè)置。


  UA封禁


  UA即為用戶代理(User-Agent),服務(wù)器通過UA識別訪問者的身份。當(dāng)網(wǎng)站針對指定UA的訪問,出現(xiàn)返回異常頁面(如404、500)或跳轉(zhuǎn)到其他頁面的情況,即為UA封禁。當(dāng)您的網(wǎng)站不希望baiduspider訪問時,才需要該設(shè)置;如果您希望baiduspider訪問您的網(wǎng)站,查看usragent的相關(guān)設(shè)置中是否baiduspiderUA,予以及時修改。


  死鏈


  頁面已經(jīng)無效,無法對用戶提供任何有價(jià)值信息的頁面就是死鏈接,包括協(xié)議死鏈和內(nèi)容死鏈兩種形式。協(xié)議死鏈,即頁面的TCP協(xié)議狀態(tài)、HTTP協(xié)議狀態(tài)明確表示的死鏈,常見的如404、403、502狀態(tài)等;內(nèi)容死鏈,即服務(wù)器返回狀態(tài)是正常的,但內(nèi)容已經(jīng)變更為不存在、已刪除或需要權(quán)限等與原內(nèi)容無關(guān)的信息頁面的死鏈。


  對于死鏈,我們建議站點(diǎn)使用協(xié)議死鏈,并通過百度站長平臺----死鏈工具向百度提交,以便百度更快地發(fā)現(xiàn)死鏈,減少死鏈對用戶以及搜索引擎造成的負(fù)面影響。


  異常跳轉(zhuǎn)


  講網(wǎng)絡(luò)請求重新指向其他位置即為跳轉(zhuǎn),異常跳轉(zhuǎn)指的是以下幾種情況。


  1.當(dāng)前該頁面為無效頁面(內(nèi)容已刪除、死鏈等),直接跳轉(zhuǎn)到前一目錄或者首頁。百度建議站長將該無效頁面的入口超鏈接刪除掉。


  2.跳轉(zhuǎn)到出錯或者無效頁面。(注:對于長時間跳轉(zhuǎn)到其他域名的情況,如網(wǎng)站更換域名,百度建議使用201跳轉(zhuǎn)協(xié)議進(jìn)行設(shè)置。)


  其他異常


  1.針對百度refer異常:網(wǎng)頁針對來自百度的refer返回不同于正常內(nèi)容的行為。2.針對百度UA的異常:網(wǎng)頁對百度UA返回不同于頁面原內(nèi)容的行為。3.JS跳轉(zhuǎn)異常:網(wǎng)頁加載了百度無法識別的JS跳轉(zhuǎn)代碼,使得用戶通過搜索結(jié)果進(jìn)入頁面后發(fā)生了跳轉(zhuǎn)的情況。4.壓力過大引起的偶然封禁:百度會根據(jù)站點(diǎn)的規(guī)模、訪問量等信息,自動設(shè)定一個合理額抓取壓力。但是在異常情況下,如壓力控制失常時,服務(wù)器會根據(jù)自身負(fù)荷進(jìn)行保護(hù)性的偶然封禁。這種情況下,請?jiān)诜祷?02(其含義是“serviceunavailable”,這樣baiduspider會過段時間再來嘗試抓取這個鏈接。如果網(wǎng)站已空閑,則會被成功抓取。