當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

百度站長平臺lee:建立符合搜索抓取習慣的網(wǎng)站

 2013-09-13 11:05  來源: A5站長網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

A5站長網(wǎng)9月13日消息:相信更多的站長每天都關注著搜索引擎的排名以及收錄問題,但是,我們的網(wǎng)站是否符合百度等其它搜索引擎抓取習慣的網(wǎng)站以及建站需要注意哪些事項等等。

對于以上的問題,在昨日(9月12日)百度站長平臺lee給大家分享了關于如何建立符合搜索抓取習慣的網(wǎng)站,詳細的介紹了網(wǎng)站的結構、url規(guī)則以及其他一些需要注意的事項等。下面我們一起來看下他的分享內(nèi)容:

Lee分享內(nèi)容:

編者按:前兩周簡要地給大家介紹了搜索抓取系統(tǒng)工作原理,根據(jù)該工作原理今天簡要介紹一下如何建立網(wǎng)站是符合搜索引擎抓取系統(tǒng)習慣的。

1、簡單明了的網(wǎng)站結構

Spider抓取相當于對web這個有向圖進行遍歷,那么一個簡單明了結構層次分明的網(wǎng)站肯定是它所喜歡的,并盡量保證spider的可讀性。

(1)樹型結構最優(yōu)的結構即“首頁—頻道—詳情頁”;

(2)扁平首頁到詳情頁的層次盡量少,既對抓取友好又可以很好的傳遞權重。

(3)網(wǎng)狀保證每個頁面都至少有一個文本鏈接指向,可以使網(wǎng)站盡可能全面的被抓取收錄,內(nèi)鏈建設同樣對排序能夠產(chǎn)生積極作用。

(4)導航為每個頁面加一個導航方便用戶知曉所在路徑。

(5)子域與目錄的選擇相信有大批的站長對此有疑問,在我們看來,當內(nèi)容較少并且內(nèi)容相關度較高時建議以目錄形式來實現(xiàn),有利于權重的繼承與收斂;當內(nèi)容量較多并且與主站相關度略差時建議再以子域的形式來實現(xiàn)。

2、簡潔美觀的url規(guī)則

(1)唯一性網(wǎng)站中同一內(nèi)容頁只與唯一一個url相對應,過多形式的url將分散該頁面的權重,并且目標url在系統(tǒng)中有被濾重的風險;

(2)簡潔性動態(tài)參數(shù)盡量少,保證url盡量短;

(3)美觀性使得用戶及機器能夠通過url即可判斷出頁面內(nèi)容的主旨;

我們推薦如下形式的url:url盡量短且易讀使得用戶能夠快速理解,例如使用拼音作為目錄名稱;同一內(nèi)容在系統(tǒng)中只產(chǎn)生唯一的url與之對應,去掉無意義的參數(shù);如果無法保證url的唯一性,盡量使不同形式的url301到目標url;防止用戶輸錯的備用域名301至主域名。

3、其他注意事項

(1)不要忽略倒霉的robots文件,默認情況下部分系統(tǒng)robots是封禁搜索引擎抓取的,當網(wǎng)站建立后及時查看并書寫合適的robots文件,網(wǎng)站日常維護過程中也要注意定期檢查;

(2)建立網(wǎng)站sitemap文件、死鏈文件,并及時通過百度站長平臺進行提交;

(3)部分電商網(wǎng)站存在地域跳轉(zhuǎn)問題,有貨無貨建議統(tǒng)一做成一個頁面,在頁面中標識有無貨即可,不要此地區(qū)無貨即返回一個無效頁面,由于spider出口的有限性將造成正常頁面無法收錄。

(4)合理利用站長平臺提供的robots、sitemap、索引量、抓取壓力、死鏈提交、網(wǎng)站改版等工具。

 

相關閱讀:

百度站長平臺lee:談spider抓取過程中的策略 

百度站長平臺lee:談百度新聞源全知道 

百度站長平臺Lee:不相關靜態(tài)搜索結果頁將被嚴厲處理 

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

熱門排行

信息推薦