一些做網(wǎng)站的站長或是一些SEOer來說,網(wǎng)站日志這個名字,一定是都聽說過 吧!都知道會看、能看懂網(wǎng)站日志,是一個seoer高手的標(biāo)志,更是一個合格的站長的必備技能,網(wǎng)站日志里記錄了,所有搜索引擎的爬行與抓取記錄,是我們 站長與seo人員,參考網(wǎng)站是否存在異常與實時的訪客記錄等!重要的參考依據(jù),但是當(dāng)我們自己真的需要看了解,網(wǎng)站日志的時候,看著那些密密麻麻的代碼, 我們又是一個頭兩個大,今天本站就交給大家如何對網(wǎng)站日志進(jìn)行分析。 1_111213135305_1 在開始介紹之前先給大家介紹下各大搜索引擎在網(wǎng)站日志中的名稱都是什么。
  1. 百度:Baiduspider
  2. 谷歌:google-googlebot
  3. 360:360Spider
  4. 搜搜:Sosospider
  5. 搜狗:Sogou News Spider
以上就是一些現(xiàn)如今一些主流的搜索引擎的蜘蛛了,如果以上的蜘蛛程序常來你的網(wǎng)站,那么恭喜你的網(wǎng)站距離成功不遠(yuǎn)了。 查看日志之前首先是需要將網(wǎng)站日志下載下來?,F(xiàn)在一般虛擬空間商都會提供“訪問日志下載”這一功能,如果沒有的話,可以在網(wǎng)站程序“wwwlogs或log”進(jìn)行下載 這里我先復(fù)制下本人一段網(wǎng)站空間日志代碼給大家看下。
2012-02-08 09:05:25 GET /default.asp – – 220.181.108.180 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) – 200 34499 421
  這是一行日志代碼,大家應(yīng)該知道Baiduspide是百度蜘蛛的名稱,我們可以從這行代碼中看到百度蜘蛛對網(wǎng)站的爬行信息。 2012-02-08 09:05:25 GET /default.asp,這個大家一看就應(yīng)該明白,意思是Baiduspider這個名稱的用戶也就是百度蜘蛛在2012-02-08 09:05:25 這個時間爬行了我們網(wǎng)站的主頁也就是default.asp頁面,這個get就是搜索引擎的一個抓取動作。 220.181.108.180,這個代表的是來訪用戶的ip地址,在這條日志中這個ip地址就代表著百度蜘蛛的ip來路。相信有過建站經(jīng)驗的朋友對這個ip應(yīng)該都是極為熟悉的了。 HTTP/1.1這個代碼代表的是一個超文本傳輸協(xié)議,接觸網(wǎng)絡(luò)的人應(yīng)該都知道網(wǎng)絡(luò)上信息的傳遞是需要通過一定的網(wǎng)絡(luò)協(xié)議的,這個HTTP/1.1就是眾多協(xié)議的一種,大家不必對這太過關(guān)注,當(dāng)然如果感興趣也可以仔細(xì)了解。
Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html)
  這段代碼Mozilla/5.0代表的意思就是用戶使用的瀏覽器是Mozilla/5.0,而括號里面的信息新站日志中如果出現(xiàn)了應(yīng)該能讓站長們興奮一會兒,它就是百度蜘蛛了,可以說是搞百度優(yōu)化站長們的衣食父母啊,對它是又愛又恨啊。 200 34499 421這段代碼中“200”代表的是蜘蛛爬行返回的狀態(tài)碼,200代表的是爬行成功的意思,34499代表的是爬行網(wǎng)頁的大小。 以上就是本站對網(wǎng)站日志的一些解答,當(dāng)然了 這只是眾多網(wǎng)站日志中的一種,在不同的空間安裝的網(wǎng)站,網(wǎng)站的日志也會不一樣的。不過只要知道http的一些狀態(tài)碼和一些代碼所代表的意思,看懂網(wǎng)站日志是沒有任何問題的。 下面著重講的應(yīng)該就是返回的狀態(tài)碼代表的含義了: 其實簡單的總結(jié)下2**的代碼代表的是正常
  • 200 正常;請求已完成。
  • 201 正常;緊接 POST 命令。
  • 202 正常;已接受用于處理,但處理尚未完成。
  • 203 正常;部分信息 — 返回的信息只是一部分。
  • 204 正常;無響應(yīng) — 已接收請求,但不存在要回送的信息。
  • 3**的代碼代表的是重定向
  • 301 已移動 — 請求的數(shù)據(jù)具有新的位置且更改是永久的。
  • 302 已找到 — 請求的數(shù)據(jù)臨時具有不同 URI。
  • 303 請參閱其它 — 可在另一 URI 下找到對請求的響應(yīng),且應(yīng)使用 GET 方法檢索此響應(yīng)。
  • 304 未修改 — 未按預(yù)期修改文檔。
  • 305 使用代理 — 必須通過位置字段中提供的代理來訪問請求的資源。
  • 306 未使用 — 不再使用;保留此代碼以便將來使用。
  • 4xx代碼代表的是客戶機(jī)中出現(xiàn)的錯誤
  • 400 錯誤請求 — 請求中有語法問題,或不能滿足請求。
  • 401 未授權(quán) — 未授權(quán)客戶機(jī)訪問數(shù)據(jù)。
  • 402 需要付款 — 表示計費系統(tǒng)已有效。
  • 403 禁止 — 即使有授權(quán)也不需要訪問。
  • 404 找不到 — 服務(wù)器找不到給定的資源;文檔不存在。
  • 407 代理認(rèn)證請求 — 客戶機(jī)首先必須使用代理認(rèn)證自身。
  • 415 介質(zhì)類型不受支持 — 服務(wù)器拒絕服務(wù)請求,因為不支持請求實體的格式。
  • 5xx的代碼代表服務(wù)器中出現(xiàn)的錯誤
  • 500 內(nèi)部錯誤 — 因為意外情況,服務(wù)器不能完成請求。
  • 501 未執(zhí)行 — 服務(wù)器不支持請求的工具。
  • 502 錯誤網(wǎng)關(guān) — 服務(wù)器接收到來自上游服務(wù)器的無效響應(yīng)。
  • 503 無法獲得服務(wù) — 由于臨時過載或維護(hù),服務(wù)器無法處理
新疆SEO點評:其實我們平常分析網(wǎng)站日志最重要的一點就是要知道這些狀態(tài)碼代表的是什么意 思,這樣才能了解網(wǎng)站頁面的獲取情況?,F(xiàn)在有好多網(wǎng)站日志分析軟件可以直接分析網(wǎng)站日志不用站長在費心費力的去查看了,不過個人感覺像這種站長基本技能新 手還是學(xué)習(xí)一下比較好,萬一那天軟件出毛病或者是有其他情況也不會啥也分析不了。