當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

百度蜘蛛狀態(tài)碼與百度快照是否有關(guān)系

 2010-05-15 10:15  來源:   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

做網(wǎng)站有大半年了,今天第一次寫這類文章。至于為什么要寫這篇文章,是因為2009年下半年以來一直到現(xiàn)在,百度經(jīng)常不正常,導致很多站長的網(wǎng)站出現(xiàn)快照不更新,快照回檔,甚至被K的現(xiàn)象。所以在A5論壇和seowhy論壇上經(jīng)常看到有些站長說,希望百度能盡快更新自己的快照。其實快照第二天是否更新,不一定要寄希望于他人,只要自己查查web日志,就能知道。也就是我今天要跟大家說的話題。

下面我就簡單的談一下關(guān)于百度蜘蛛訪問網(wǎng)站后,web日志所返回的狀態(tài)碼與首頁的百度快照是否會更新之間的關(guān)系,所談到的都是小弟大半年以來每天觀察自己網(wǎng)站的web日志里百度蜘蛛的爬行痕跡所摸索出來的規(guī)律,希望對大家有些幫助。

大家可以嘗試著打開web日志的.log文件,web日志的默認路徑是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虛擬主機的朋友可以找空間商索要。打開文件夾下的.log文件,搜索百度蜘蛛,百度蜘蛛的名字為baiduspider。然后一直Enter,可以查出百度蜘蛛訪問網(wǎng)站后留下的所有足跡。在查找中,注意一下百度蜘蛛名字前面的IP,還有整行最后的狀態(tài)碼。

一般情況下,蜘蛛抓取網(wǎng)頁如果返回200 0 0代碼,則表示該網(wǎng)頁已經(jīng)成功編入索引,200 0 64是指索引數(shù)據(jù)庫已經(jīng)存在,沒有發(fā)現(xiàn)網(wǎng)頁有更新的內(nèi)容,不需要重新索引的意思。304 0 0是指原來緩沖的文檔還可以繼續(xù)使用,跟200 0 64意思應該差不多吧。 (值得一提的是:200 0 64并不是網(wǎng)上很多人說的會被K站或降權(quán),是正?,F(xiàn)象,動態(tài)網(wǎng)站抓取的時候大多數(shù)出現(xiàn)200 0 0,即便是網(wǎng)站沒有更新。)

在說一下蜘蛛IP,我的web日志里查到的蜘蛛IP一般都是220.181.7.*和123.125.66.*比較多,還有一個61.135.162.*,這三個段的IP是抓取網(wǎng)頁的,123.125.68.*這個段的是百度沙盒蜘蛛IP。61.135.168.*這個段的蜘蛛是抓取圖片的。不過百度蜘蛛應該還有很多,可能是按照網(wǎng)站的地區(qū)和線路發(fā)放蜘蛛的吧。具體情況還要具體對待。不過有一點可以肯定的是,在網(wǎng)站沒被降權(quán)的情況下,只要有兩個IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*這兩個段)都抓取了網(wǎng)站首頁且返回的狀態(tài)碼是200 0 0,那就不用每天等到零晨四點看百度更新首頁的快照了(我以前經(jīng)常等到凌晨四五點才睡覺,呵呵,不過現(xiàn)在一般都是在早上六七點才更新快照)。

一般百度首頁快照比較慢、網(wǎng)站權(quán)重比較低或者被降權(quán)的網(wǎng)站,蜘蛛一般都是返回的200 0 64的狀態(tài)碼。我有一個被K過的網(wǎng)站,當時每天都只有123.125.68.*這個段的IP,且狀態(tài)碼都是返回的200 0 0。

本文由熱血傳奇* 站長原創(chuàng),首發(fā)于admin5,轉(zhuǎn)載請保留鏈接,謝謝!

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

熱門排行

信息推薦