筆者近日剛剛上線一個(gè)新站,于是開始關(guān)注一些有關(guān)SEO的信息,偶然間搜索到一篇文章,題為:“百度蜘蛛IP段詳解”,內(nèi)容為介紹通過分析網(wǎng)站日志中百度蜘蛛爬行的IP段來了解網(wǎng)站首頁或內(nèi)頁的收錄放出情況。看后,筆者便親自試驗(yàn)了一下,發(fā)現(xiàn)可能并不可信。
文中曾提到:“220.181.108.95這個(gè)是百度抓取首頁的專用IP,如是220.181.108段的話,基本來說你的網(wǎng)站會(huì)天天隔夜快照,絕對(duì)錯(cuò)不了的,我保證。”
那么筆者查詢了下日志中,IP為220.181.108.95的蜘蛛爬行日志:“220.181.108.95 - - [31/Dec/2013:12:04:42 +0800] "GET / HTTP/1.1" 400 39 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +)" "-"”,筆者的站地址為:一問網(wǎng)日志爬行時(shí)間為2013年12月31日中午12點(diǎn),截止投稿前,首頁快照還停留在幾個(gè)月以前,并未如文章中所說隔夜快照。
此時(shí)筆者便有了疑問,于是又找了一個(gè)文中作者曾經(jīng)保證過的另外一個(gè)IP,文中原文為:“220.181.108.*段IP主要是抓取首頁占80%,內(nèi)頁占30%,這此爬過的文章或首頁,絕對(duì)24小時(shí)內(nèi)放出來和隔夜快照的,這點(diǎn)我可以保證!”
而筆者又查詢了下日志中是否存在此IP,發(fā)現(xiàn)確實(shí)存在,而且還不少:
220.181.108.116 - - [31/Dec/2013:03:17:17 +0800] "GET / HTTP/1.1" 200 3652 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +)" "-"
220.181.108.112 - - [31/Dec/2013:07:56:58 +0800] "GET / HTTP/1.1" 200 3652 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +)" "-"
220.181.108.108 - - [31/Dec/2013:08:55:43 +0800] "GET / HTTP/1.1" 200 3652 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +)" "-"
220.181.108.80 - - [31/Dec/2013:09:57:11 +0800] "GET / HTTP/1.1" 400 39 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +)" "-"
由于內(nèi)容過多,便不過多列舉,像文中作者所保證的("220.181.108.*段IP主要是抓取首頁占80%,內(nèi)頁占30%,這此爬過的文章或首頁,絕對(duì)24小時(shí)內(nèi)放出來和隔夜快照的"。)結(jié)果并未出現(xiàn),一問網(wǎng)www.yiwen.cn,至今距離百度蜘蛛爬過已經(jīng)過48小時(shí),并未放出。
由此可見,網(wǎng)上所流傳的百度蜘蛛IP段詳解可能并不可信。以上是筆者的一人之見,請大家多多批評(píng)指教,歡迎大家找我討論,郵箱:z#yiwen.cn(請把#換成@)。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!