并不是所有的網(wǎng)頁對用戶都有意義,比如一些明顯的欺騙網(wǎng)頁、死鏈接、空白內(nèi)容頁等。這些網(wǎng)頁對用戶、站長和百度來說都不夠有價值,所以百度會自動過濾這些內(nèi)容,避免給用戶和你的網(wǎng)站帶來不必要的麻煩。
搜索引擎為用戶顯示的每個搜索結(jié)果都對應(yīng)于互聯(lián)網(wǎng)上的一個頁面,每個搜索結(jié)果都需要四個過程:抓取、過濾、索引和輸出。
1、抓取
百度蜘蛛,或稱百度蜘蛛,將通過計算確定哪些網(wǎng)站需要爬行,以及爬行的內(nèi)容和頻率,通過搜索引擎系統(tǒng)進(jìn)行計算。搜索引擎的計算過程將參考您網(wǎng)站在歷史上的表現(xiàn),如內(nèi)容是否足夠好,是否有用戶友好的設(shè)置,是否有過度的搜索引擎優(yōu)化行為等。
當(dāng)你的網(wǎng)站生成新內(nèi)容時,baiduspider會通過一個鏈接訪問并爬行到互聯(lián)網(wǎng)上的頁面。如果你沒有設(shè)置任何外部鏈接到網(wǎng)站上的新內(nèi)容,Baiduspider就無法對其進(jìn)行爬行。對于已捕獲的內(nèi)容,搜索引擎將記錄捕獲的頁面,并根據(jù)這些頁面對用戶的重要性,安排不同頻率的捕獲更新。
需要注意的是,有一些爬行軟件,出于各種目的,會偽裝成baiduspider來爬行你的網(wǎng)站,這可能是不受控制的爬行行為,嚴(yán)重影響了網(wǎng)站的正常運行。點擊此處確認(rèn)白杜鵑的真實性。
2、過濾
并不是所有的網(wǎng)頁對用戶都有意義,比如一些明顯的欺騙網(wǎng)頁、死鏈接、空白內(nèi)容頁等。這些網(wǎng)頁對用戶、站長和百度來說都不夠有價值,所以百度會自動過濾這些內(nèi)容,避免給用戶和你的網(wǎng)站帶來不必要的麻煩。
3、索引
百度對檢索到的內(nèi)容逐一進(jìn)行標(biāo)記和識別,并將這些標(biāo)記存儲為結(jié)構(gòu)化數(shù)據(jù),如標(biāo)記標(biāo)題、元描述、外部鏈接、描述和捕獲記錄。同時,網(wǎng)頁中的關(guān)鍵字信息將被識別和存儲,以便與用戶搜索的內(nèi)容相匹配。
4、輸出
百度將對用戶輸入的關(guān)鍵詞進(jìn)行一系列復(fù)雜的分析,并根據(jù)分析結(jié)論在索引數(shù)據(jù)庫中找到一系列與之最匹配的頁面。關(guān)鍵字根據(jù)用戶的需求和頁面的優(yōu)缺點進(jìn)行評分,并根據(jù)最終得分進(jìn)行排列,并顯示給用戶。
本文由岑輝宇博客整理發(fā)布,微信搜索微信公眾號“岑輝宇 ”可查看更多內(nèi)容。
更多SEO教程:http://www.cenhuiyu.com/
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!