將鏈接作為衡量網(wǎng)站重要程度的方法這一理念,第一次流行是由于谷歌實(shí)施其PR值算法(其他公司之前也寫過使用鏈接作為排名因素,但谷歌快速增長的用戶群使其變得備受矚目)。簡單來說,網(wǎng)頁得到的鏈接是對這個網(wǎng)頁的投票,但不能單純地認(rèn)為“得到最多投票的那個頁面獲得勝利”。鏈接和鏈接到的頁面并不完全等同。
一些頁面通過谷歌的PR值算法會得到比其他頁面更重要的權(quán)重。
這一概念的關(guān)鍵在于,鏈接代表了對一個網(wǎng)上文件的“自愿背書”。搜索引擎嚴(yán)重依賴于自愿投票。然而,隨著內(nèi)容發(fā)布商了解到了鏈接的作用,一些發(fā)布商開始用各種方法操控鏈接。這種情況下鏈接的含義在本質(zhì)上不再是自發(fā)的,所以致使人們對很多算法進(jìn)行了改進(jìn)。
為了幫助你了解鏈接算法的起源,即至今仍在使用的邏輯基礎(chǔ),讓我們一起學(xué)習(xí)原始PR值算法的細(xì)節(jié)。
原始PR值算法
PR值算法的建立是基于Sergey Brin及Larry Page在斯坦福大學(xué)讀博士時所寫的原始PR值算法論文。
用最簡單的話說,論文認(rèn)為指向一個網(wǎng)頁的每一個鏈接都是對這個頁面的投票。不過,如之前所說,投票并不具有相同的權(quán)重。為了更好地理解PR值是如何計算的,我們將會在較高水平上詮釋PR值算法。首先,所有的頁面都被賦予了一個與生俱來但值很小的PR值,如圖
每個頁面都pr值
然后頁面可以通過從其他頁面獲得鏈接來提升自身的PR值,如圖7-2所示。
頁面通過鏈接來獲得更多PR值
一個頁面可以通過鏈接向其他頁面?zhèn)鬟f多少PR值呢?結(jié)果比這個頁面本身的PR值要少。如圖7-3所示,顯示為f(x)。也就是說可傳遞的PR值是總PR值x的函數(shù)。2009年Matt Cutts寫過一篇文章,認(rèn)為一個頁面可以傳遞其自身PR值的85%~90%。
一個頁面PR值的一部分傳遞到其他的頁面
如果這個頁面僅僅鏈接向一個其他頁面,它就將自身所有的PR值傳遞到那個頁面,如圖7-4所示,頁面B得到頁面A所有可傳遞的PR值。
通過鏈接傳遞PR值
不過實(shí)際情況更復(fù)雜些,因?yàn)轫撁鏁溄酉虿恢挂粋€其他頁面。在這種情況下,可以傳遞的PR值在得到鏈接的所有頁面之間分配。如圖7-5所示,頁面B和頁面C各得到頁面A可傳遞PR值的一半。
通過鏈接傳遞PR值
在PR值原始計算公式中,鏈接權(quán)重在頁面上所有鏈接之間平均分配。但是在今天已經(jīng)不是這樣了,但它對于理解原始意圖還是有價值的?,F(xiàn)在來看圖7-6所表述的一個更加復(fù)雜的例子,PR值在兩個相互鏈接的頁面之間來回流轉(zhuǎn)。
頁面之間交叉鏈接
交叉鏈接使PR值計算變得更加復(fù)雜。在圖7-6中,頁面B鏈接回頁面A,同時也傳遞一些PR值f(y)回頁面A。圖7-7應(yīng)該使你能更好地理解這是如何影響所有頁面的PR值的。
迭代PR值計算
需要注意的關(guān)鍵點(diǎn)是頁面B鏈接向頁面A時,使得鏈接成為雙向的。頁面A的PR值x變得依賴于f(y),即頁面B可傳遞的PR值,而這個數(shù)值又恰巧依賴于f(x)!而且,頁面A傳遞向頁面C的PR值也受到頁面B指向頁面A的鏈接的影響。這就使情況變得非常復(fù)雜。網(wǎng)上每個頁面的PR值計算必須通過遞歸分析才能確定。
為了說明這點(diǎn),我們定義新的參數(shù):q,代表頁面B由于來自頁面A的鏈接所增加的PR值(所有的迭代計算完成之后);z,代表頁面A由于頁面B的鏈接而增加的PR值(同理,所有的迭代計算完成之后)。
所示情況又增加了復(fù)雜程度,因?yàn)橐胍粋€從頁面B到頁面D的鏈接。在這個例子中,頁面A、B、C是一個域名的內(nèi)部鏈接,頁面D代表了另外一個網(wǎng)站(圖中顯示為*)。在原始的PR公式中,內(nèi)部鏈接和外部鏈接以完全相同的方式傳遞PR值。這發(fā)現(xiàn)是個缺陷,因?yàn)閮?nèi)容發(fā)布商開始意識到鏈接向其他網(wǎng)站會從自己網(wǎng)站泄露PR值
PR值泄露
正如例子所示,因?yàn)轫撁鍮鏈接到*,可傳遞PR值的一部分就被傳遞到那里,而不是傳遞到頁面B鏈接到的其他頁面(如我們例子中的頁面A)。在圖7-8中以參數(shù)w表示這一點(diǎn),w是由于鏈接向頁面D而沒有傳遞到頁面A的PR值。
PR值泄露的概念在算法公開后就成為一個根本缺陷。當(dāng)頁面創(chuàng)建者研究PR值的基本原理時,他們意識到從自己的網(wǎng)站鏈接出去弊大于利。如果大量網(wǎng)站都認(rèn)同這個想法,這將對“鏈接就是投票”的概念產(chǎn)生負(fù)面影響,從而破壞谷歌算法的質(zhì)量。不用說,谷歌很快糾正了它算法的這個缺陷。由于這些改變,你不用再擔(dān)心PR值泄露了。高質(zhì)量網(wǎng)站應(yīng)該鏈接到網(wǎng)絡(luò)上其他相關(guān)高質(zhì)量的頁面。
即使有了這些改變,頁面內(nèi)部鏈接還是會傳遞一些PR值,因此還是有價值的
內(nèi)部鏈接仍會傳遞一部分PR值
谷歌已經(jīng)持續(xù)修改和調(diào)整了它使用鏈接影響排名的方法,當(dāng)前的算法不是基于它最原始定義的PR值算法。不過,熟悉和了解原始算法,對優(yōu)化谷歌結(jié)果的人還是有一些好處的。
所有基于鏈接的算法都建立在一種假設(shè)上,即大部分的鏈接收到了內(nèi)容發(fā)布商鏈接到你網(wǎng)站鏈接的合法背書。實(shí)現(xiàn)鏈接的人會這樣做,因?yàn)樗X得他正在鏈接到一個與他的網(wǎng)站訪客相關(guān)的大資源。
在理想的世界中,鏈接類似于科學(xué)家發(fā)表文章末尾的學(xué)術(shù)引文,她引用她已參考的其他工作來完成她的研究。
如果內(nèi)容發(fā)布商添加鏈接作為補(bǔ)償,那么鏈接到搜索引擎的價值便減少了,并且這樣的鏈接對搜索引擎算法有害。其實(shí)補(bǔ)償可以以金錢形式或特別場景,我們將在本章有更多的探討。
文章來源:麥可seo
來源地址:http://www.maikeseo.com/zhanwai/1518.html
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!