以前看過一篇關(guān)于 IIS日志中 有關(guān)200 0 64的文章,原文的地址我也記不清楚了。當(dāng)時(shí)自己的網(wǎng)站也沒有出現(xiàn)這樣的字符,所以當(dāng)時(shí)也不是很關(guān)心,后來,網(wǎng)站被拔毛。新站一直不收錄。查找了很多原因,才得出了把64變成0的方法,這個(gè)方法我不敢保證對(duì)你們適用,但是我的站點(diǎn)確實(shí)是這樣的。
先看看64在IIS中的解釋。在DOS里輸入 net helpmsg 64 出現(xiàn)指定的網(wǎng)絡(luò)名不再可用,但是訪問的話還可以訪問啊。問題究竟是出在哪里呢? 這僅僅是IIS自身的http狀態(tài)說明。
以前的文章中是這樣解釋的:
眾所周知,百度是有人工干預(yù)的,這64說明了什么?
根據(jù)我前段時(shí)間到現(xiàn)在的觀察,雖然沒有足夠的證據(jù),但是基本上可以肯定在IIS中,如果蜘蛛后面的號(hào)碼出現(xiàn)200 0 64
那么網(wǎng)站中的這個(gè)單頁面就會(huì)在搜索引擎中消失了.我被K的頁面后面都寫著200 0 64 ,不知道大家是否認(rèn)同,還有其他看法,當(dāng)然,我說這個(gè)不夠絕對(duì),因?yàn)槲乙灿幸粋€(gè)頁面后面顯示著200 0 64 但是在搜索引擎中依舊可以找到.這也說明著問題,但大多200 0 64行為的網(wǎng)頁就已經(jīng)沒有了.所以我覺得蜘蛛的200 0 64行為可以被解釋為清除數(shù)據(jù)。
這個(gè)解釋,目前看上去還是有可信度的。flymorn認(rèn)為,抓取狀態(tài)成200 0 64是不正常的抓取,正常的抓取是成功標(biāo)志200 0 0,當(dāng)變成了200 0 64的狀態(tài)時(shí)說明搜索引擎在抓取這個(gè)頁面的時(shí)候出現(xiàn)了錯(cuò)誤,沒有正常的進(jìn)行常規(guī)抓取;對(duì)于百度來說,百度很可能是已經(jīng)不再把這些頁面抓進(jìn)主索引庫,而是放 進(jìn)了“百度沙盒”里進(jìn)行考察,考察多久,就看你如何改進(jìn),也許,你看不到百度把這些被K的網(wǎng)站釋放出來的時(shí)候,人是沒有規(guī)律的。
正好,我也有被百度K的網(wǎng)站,打開這個(gè)網(wǎng)站的IIS日志(.log后綴,如ex080222.log),果不其然,也發(fā)現(xiàn)了百度返回200 0 64的狀態(tài):2008-02-22 07:14:37 W3SVC78302822 58.17.36.91 GET /article/1/79.html - 80 - 61.135.163.102 Baiduspider+(+[url][/url]) 200 0 64
2008-02-22 07:18:07 W3SVC78302822 58.17.36.91 GET /article/1/11.html - 80 - 61.135.163.102 Baiduspider+(+[url][/url]) 200 0 64
這篇文章估計(jì)在搜索引擎里搜索200 0 64這樣的內(nèi)容的話,能搜出來很多。都千篇一律!不能不佩服網(wǎng)絡(luò)的力量太大了!
隨后我查看IIS日志,發(fā)現(xiàn)對(duì)robots文件一直是 200 0 0 ,對(duì)圖片還有JS,也是同樣。對(duì)沒有做過優(yōu)化的頁面 出現(xiàn)的也是200 0 0 對(duì)欄目頁和內(nèi)容頁及首頁都出現(xiàn)了200 0 64這樣的情況,當(dāng)時(shí)我想有可能是優(yōu)化過度吧!所以我就把這些模板頁的優(yōu)化給降低了一些。把欄目頁 的連接也去掉了。文章中的連接我也去掉了。這些如果不去掉是否會(huì)發(fā)生改變。我沒測(cè)試!當(dāng)時(shí)改過之后。蜘蛛爬過來還是200 0 64 ;當(dāng)時(shí)心里還是不很舒服。但是改都改過了,就這樣吧!到晚上8:30以后我登陸服務(wù)器看日志的時(shí)候,看到百度蜘蛛一個(gè)挨一個(gè)的來,并且后面出現(xiàn)的都是200 0 0;當(dāng)時(shí)心里真是高興啊。晚上做夢(mèng)都在想。服務(wù)器日志打開都是200 0 0;上班后,我登陸服務(wù)器查看iis日志發(fā)現(xiàn)果真都是200 0 0;但是5月27號(hào)之前的還都是200 0 64,為什么呢?我想可能是因?yàn)橐郧爸┲雭碓L的時(shí)候,都是200 0 64 畢竟一個(gè)多月的內(nèi)容啊。它會(huì)慢慢更新的。我看日志上顯示的是5月27號(hào)的文章全部是200 0 0;而5月27號(hào)之前的文章都是200 0 64;我期待著一個(gè)奇跡出現(xiàn)。希望這兩天剛蜘蛛能把我5月27號(hào)之前的內(nèi)容也更新過來!
說一下個(gè)人的方法:
第一:頁面優(yōu)化過度,趕緊減少你的優(yōu)化,不要讓百度認(rèn)為你是作弊的!
第二:Head部分與其它頁面重復(fù)次數(shù)太多,特別是標(biāo)題,keyword和description;要讓蜘蛛來到之后嘗到新鮮的“食物”;對(duì)于網(wǎng)站中重復(fù)的內(nèi)容用JS調(diào)用;
第三:頁面相似度太高;不要整個(gè)網(wǎng)站都是相同的內(nèi)容;適當(dāng)?shù)淖円幌履0?。或者css樣式;
第四:大量的垃圾外鏈指向內(nèi)頁;去掉不必要的超級(jí)鏈接;
第五:頁面的內(nèi)容少。滿頁都是廣告!其實(shí)在沒有被收錄之前,你可以先不放廣告位,把JS文件寫進(jìn)去,等來流量了、把你的JS文件放上廣告代碼。
我也在期待著我的文章全部變?yōu)?00 0 0;讓我們共同努力吧!
希望大家和我交流:QQ:35260369 本文首發(fā):中國IT技術(shù)安全網(wǎng)
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!