當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

網(wǎng)站優(yōu)化:網(wǎng)址規(guī)范化(URL canonicalization)

 2015-09-06 17:20  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

SEO網(wǎng)址定律:規(guī)范的網(wǎng)址書寫方式,有利于提高網(wǎng)站主頁(yè)權(quán)重。

1、出現(xiàn)不規(guī)范網(wǎng)址的原因

搜索引擎會(huì)自動(dòng)挑選最合適的URL做為一個(gè)網(wǎng)站的網(wǎng)址。眾所周知,我們打開(kāi)IE在地址欄里輸入網(wǎng)址,根據(jù)各人用戶體驗(yàn)的習(xí)慣不同,輸入的方式也不同。這就是會(huì)出現(xiàn)不規(guī)范的網(wǎng)址的原因。如:

l

l

l

l

l (較少使用)

以上這五種常見(jiàn)的輸入網(wǎng)址的方式,明眼能看出來(lái)其實(shí)是指向同一個(gè)頁(yè)面:主頁(yè)。

從技術(shù)上來(lái)說(shuō),在計(jì)算機(jī)處理時(shí),每一個(gè)字符對(duì)應(yīng)一個(gè)編碼(詳見(jiàn)計(jì)算機(jī)科學(xué)導(dǎo)論類書籍);而搜索引擎是把以上網(wǎng)址當(dāng)成不同的地址來(lái)看待,雖然最終返回的都是主頁(yè)。

現(xiàn)在簡(jiǎn)要分析一下以上網(wǎng)址的技術(shù)問(wèn)題:

有沒(méi)有帶www,有什么不同?在DNS中,www是你要解析的主機(jī)名。在做域名解析時(shí),會(huì)要你為域名:domain.com填寫一個(gè)主機(jī)名,我們一般填:www 。當(dāng)然,也可以填 bbs或者其它的諸如abcde等等。如果填,那么,主機(jī)返回的頁(yè)面就不一樣。對(duì)搜索引擎來(lái)說(shuō),這是兩個(gè)不同的站點(diǎn),兩個(gè)不同的頁(yè)面。兩個(gè)都要計(jì)算PR值。

具例:和在搜索引擎看來(lái)就是兩個(gè)不同的站點(diǎn)。其中,的PR值為8,而的PR值等于6。但從人為上判斷,這其實(shí)是同一個(gè)站點(diǎn)。

另一個(gè)問(wèn)題,帶與不帶index.html,對(duì)用戶感覺(jué)沒(méi)什么區(qū)別。但對(duì)蜘蛛說(shuō)就感到比較暈:哪一個(gè)才是主頁(yè)?蜘蛛到底該返回哪個(gè)頁(yè)面?這種方法對(duì)蜘蛛不友好。

https是加密網(wǎng)址,可以理解為http的安全版,端口:443,采用SSL協(xié)議,詳見(jiàn)《TCP/IP協(xié)議》有關(guān)書籍。如果和http同時(shí)存在也會(huì)被認(rèn)為是不同的頁(yè)面,搜索引擎會(huì)分別計(jì)算,從而降低了頁(yè)面的權(quán)重。如:的PR值等于6,而的PR值為:n/a。

以上的不同的域名寫法,造成的PR值的不同

所以,一個(gè)網(wǎng)址在推廣時(shí),網(wǎng)址的規(guī)范寫法很重要。這直接影響到域名的權(quán)重。而不帶www的域名,對(duì)搜索引擎很不友好。畢竟蜘蛛是程序,在不規(guī)范的網(wǎng)址中要挑一個(gè)出來(lái)做為規(guī)范的網(wǎng)址,不僅浪費(fèi)主頁(yè)的權(quán)重,而且還浪費(fèi)蜘蛛的時(shí)間和網(wǎng)絡(luò)帶寬。要知道,蜘蛛一生氣,后果很嚴(yán)重。

2、避免不規(guī)范網(wǎng)址降低網(wǎng)站首頁(yè)權(quán)重

據(jù)估計(jì),現(xiàn)在網(wǎng)絡(luò)上的網(wǎng)址,不規(guī)范的寫法近30%。在浪費(fèi)資源,浪費(fèi)帶寬的同時(shí),有可能搜索引擎選出的規(guī)范網(wǎng)址并不是站長(zhǎng)想要的。對(duì)站長(zhǎng)來(lái)說(shuō),多個(gè)不規(guī)范的URL鏈接的存在不但不利于排名,更是分散了主頁(yè)的權(quán)重。不規(guī)范的影響了網(wǎng)站的收錄不是好事,必須避免。

避免不規(guī)范網(wǎng)址,不管是新站還是老站,都是要長(zhǎng)期跟進(jìn)的一項(xiàng)工作。要有恒心才能見(jiàn)到效果。新站從一開(kāi)始就注意到這點(diǎn)的話,一兩年后,效果還是很明顯的。具體如下:

l 新站在發(fā)展友鏈時(shí),盡可能地要求對(duì)方規(guī)范書寫網(wǎng)址,統(tǒng)一寫法。而老站,應(yīng)盡可能地修復(fù)不規(guī)范的友鏈。

l 內(nèi)鏈中,首先自已要規(guī)范書寫網(wǎng)址,文章發(fā)布時(shí),也要規(guī)范書寫網(wǎng)址。

l 谷歌管理工具中,將不帶3w的網(wǎng)址以及其它不規(guī)范的寫法定向?yàn)閹?w的規(guī)范網(wǎng)址。

l 使用canonical標(biāo)簽。下節(jié)討論。

l 制作sitemap文件,在sitemap文件里全部使用規(guī)范網(wǎng)址,以利蜘蛛爬行。

l 一些CMS中添加了許多文章,里面如有大量?jī)?nèi)鏈不規(guī)范,可在robots文件中禁止蜘蛛爬行,在修復(fù)后,再允許蜘蛛爬行。

l 無(wú)論網(wǎng)站是否有靜態(tài)化的功能,在開(kāi)發(fā)和對(duì)系統(tǒng)設(shè)置時(shí)要做到系統(tǒng)只產(chǎn)生規(guī)范網(wǎng)址。

l 設(shè)置.htaccess文件,用301重定向把其他URL重定向到規(guī)范網(wǎng)址。

以上提到的方法可混合使用,具體情況靈活處理。網(wǎng)址規(guī)范化是讓站長(zhǎng)和蜘蛛非常困擾的一個(gè)課題。需要站長(zhǎng)長(zhǎng)期堅(jiān)持才能見(jiàn)效。

3、canonical標(biāo)簽與301重定向

在2009年,Google,雅虎,微軟共同發(fā)布了一個(gè)新的標(biāo)簽:canonical tag,用于解決網(wǎng)址規(guī)范化問(wèn)題。canonical標(biāo)簽有什么用?

1. 網(wǎng)址規(guī)范。

2. 傳遞、繼承頁(yè)面權(quán)重。

3. 重復(fù)頁(yè)面精確重定向,利于蜘蛛收錄。

注意,canonical標(biāo)簽只對(duì)同一域名下的網(wǎng)址有效,如果跨站,建議用301重定向。這就是canonical標(biāo)簽與301重定向的區(qū)別所在。

如下面所示網(wǎng)址的頁(yè)面是相同的

那么我們可以在head meta部分加入如下代碼:

這樣是告訴搜索引擎:后兩個(gè)頁(yè)面的內(nèi)容是重復(fù)內(nèi)容,是同一個(gè)頁(yè)面,就是告知搜索引擎把相關(guān)的搜索信號(hào)都傳遞到第一個(gè)網(wǎng)址。

這樣一樣所有含有這個(gè)標(biāo)簽的網(wǎng)頁(yè),不管它的URL是什么,搜索引擎最終都會(huì)只收錄 canonical標(biāo)簽指定的那個(gè)頁(yè)面,所有的權(quán)重也會(huì)在指定的這個(gè)頁(yè)面上繼承。這樣,所有原本分散的權(quán)重都會(huì)集中傳遞在指定的這個(gè)頁(yè)面上。

另外,使用canonical標(biāo)簽要注意以下幾點(diǎn):

1. 這個(gè)標(biāo)簽只是對(duì)搜索引擎起到參考和建議的作用,并不是像robots文件那樣是個(gè)命令,就算是做了canonical標(biāo)簽,也不百分百保證是搜索引擎認(rèn)可的規(guī)范網(wǎng)址,搜索引擎會(huì)智能地綜合參考其他的因素進(jìn)行判斷。

2. 在canonical標(biāo)簽中,最好使用絕對(duì)地址,雖然可以使用相對(duì)地址。

3. 針對(duì)國(guó)內(nèi)用戶的網(wǎng)站特別注意,百度不支持這個(gè)標(biāo)簽。

4. canonical標(biāo)簽指定的網(wǎng)址可以是不存在的頁(yè)面內(nèi)容,如404頁(yè)面。如果閑得沒(méi)事干的話可以這么做。

5. 建議canonical標(biāo)簽在同一域名下使用。是否跨站,爭(zhēng)議太大。

什么是301轉(zhuǎn)向?301轉(zhuǎn)向也叫301網(wǎng)址重定向,是用戶或者搜索引擎在向服務(wù)器發(fā)出請(qǐng)求指令時(shí),服務(wù)器返回HTTP頭的一個(gè)信息(一個(gè)代碼,如:301、404等),用來(lái)告訴用戶或蜘蛛:原來(lái)的網(wǎng)址現(xiàn)在不用了,永遠(yuǎn)轉(zhuǎn)向新啟用的新網(wǎng)址。

301轉(zhuǎn)向,能使新域名繼承老域名的權(quán)重。

cmfu是起點(diǎn)的老域名,而qidian是新域名。

老域名cmfu.com用301轉(zhuǎn)向新域名,權(quán)重也轉(zhuǎn)向新域名。而老域名則被永遠(yuǎn)認(rèn)為被轉(zhuǎn)到qidian.com這個(gè)新域名上了。

做301域名轉(zhuǎn)向,可以用.htaccess文件,JS代碼(如國(guó)內(nèi)某知名電信服務(wù)運(yùn)營(yíng)商,大家可以查看其JS代碼),ASP代碼、PHP代碼。

現(xiàn)具例如下:

Redirect 301 /path/from/ file.html

上面的代碼加到.htaccess文件中,主要是告訴搜索引擎,以后所有到/path/from/ file.html的請(qǐng)求,都轉(zhuǎn)到上。301狀態(tài)碼,就是告訴蜘蛛,原來(lái)的頁(yè)面被永遠(yuǎn)轉(zhuǎn)走了。

前面我們提到,將所有不規(guī)范的不帶3w的網(wǎng)址轉(zhuǎn)到規(guī)范的網(wǎng)址上。這時(shí)就要打開(kāi).htaccess文件進(jìn)行修改。我們打開(kāi)一個(gè)網(wǎng)站的.htaccess文件,中文是我添加的注釋:

##

##如果要使用復(fù)定向模塊,這個(gè)選項(xiàng)必須是On

# if you want to use mod_rewrite, set this 'On'

RewriteEngine On

# the path to your site installation

RewriteBase /

# Maintenance Section - Uncomment the lines below according to your need

# Write below your client IP address (e.g.: 127.0.0.1)

# if you need to keep your web access during maintenance

#RewriteCond %{REMOTE_ADDR} !^127.0.0.1$

# Choose your way of closing the access to PMF:

# a. you can simply forbid access (HTTP 403 Error)

#RewriteRule ^(.*)$ underMaintenance.htm [F,L]

# b. return the user an explanation

#RewriteRule ^(.*)$ underMaintenance.htm [L]

##將所有不帶3w的網(wǎng)址,轉(zhuǎn)為帶3w的規(guī)范網(wǎng)址。重定向代碼須要寫在所有的代碼前面。

# url canonicalization

RewriteCond %{http_host} ^abcde.com [NC]

RewriteRule ^(.*)$ [L,R=301]

##404錯(cuò)誤頁(yè)面

# 404 page

ErrorDocument 404 /404.html

使用301注意一點(diǎn):HTML靜態(tài)頁(yè)面不支持。接下來(lái)看看在PHP中如何做301重定向代碼:

Header(“HTTP/1.1 301 Moved Permanently”);

Header(“Location:;);

將上面的兩行代碼加到PHP代碼中即可。

301重定向,還有以下用途:

l 多個(gè)域名如.cn,.net,.org,.cc等全部轉(zhuǎn)向主域名.com。

l Domaina123b123c123d123e123.com可以轉(zhuǎn)來(lái)短域名:doabcde.com

l 網(wǎng)站改版、URL命名系統(tǒng)改變。

l 動(dòng)態(tài)化的URL轉(zhuǎn)靜態(tài)化的URL。

以上介紹了不規(guī)范網(wǎng)址產(chǎn)生的原因、處理方法,隨著搜索引擎算法的更變,SEO的方法也不斷更新。不擔(dān)保所做的操作百分百有效。本文僅供SEO技術(shù)上交流使用。作者碼字截圖很辛苦,轉(zhuǎn)載請(qǐng)保留作者及鏈接,萬(wàn)分謝意!

SEO專題推薦:

關(guān)鍵詞優(yōu)化專題:網(wǎng)站關(guān)鍵詞優(yōu)化沒(méi)效果?來(lái)這里學(xué)習(xí)最實(shí)用的關(guān)鍵詞優(yōu)化技巧!

內(nèi)鏈優(yōu)化專題:最能提升網(wǎng)站權(quán)重的內(nèi)鏈部署優(yōu)化技巧與方法

外鏈建設(shè)專題:高質(zhì)量自然外鏈怎么做?讀完這些你將質(zhì)的飛躍

網(wǎng)站降權(quán)專題:2015年最有用的網(wǎng)站降權(quán)、被K、被黑、被攻擊的解決方法

用戶體驗(yàn)專題:學(xué)習(xí)完這些,作為站長(zhǎng)的你可以秒懂如何做網(wǎng)站用戶體驗(yàn)

行業(yè)網(wǎng)站專題:優(yōu)化行業(yè)網(wǎng)站的“葵花寶典”看完后無(wú)優(yōu)化壓力

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦