在網(wǎng)站建設(shè)的過程中,經(jīng)常會出現(xiàn)一個讓人煩惱的問題,那就是網(wǎng)頁相似度很高,而一旦出現(xiàn)這種問題,就很難提升網(wǎng)站的排名,甚至還會造成百度的降權(quán)或者懲罰。那么什么是網(wǎng)頁相似度呢?
通常網(wǎng)頁的相似度主要指的是兩個網(wǎng)頁的內(nèi)容有很多部分相同。當(dāng)搜索引擎對比兩個網(wǎng)頁時,會通過兩種方法進(jìn)行對比分析。第一是根據(jù)網(wǎng)頁內(nèi)容上的摘要模塊進(jìn)行分析,如果兩個網(wǎng)頁上MD5值數(shù)據(jù)一樣,那么這兩個網(wǎng)頁的相似性就非常高。第二,就是根據(jù)網(wǎng)頁上的關(guān)鍵詞頻度和排序進(jìn)行分析。在一個網(wǎng)頁上獲得詞頻較高的關(guān)鍵詞,然后進(jìn)行MD5賦值,如果兩個網(wǎng)頁的關(guān)鍵詞MD5值一樣,那么說明具有較高的相似度。
目前搜索引擎能夠認(rèn)可的網(wǎng)頁相似度不能夠超過60%,如果超過60%,那么就會被相應(yīng)的搜索引擎懲罰,導(dǎo)致被降權(quán)或者屏蔽。那么造成網(wǎng)頁相似度的因素有哪些呢?具體來看主要有兩個方面的原因:第一,同一個網(wǎng)站里,經(jīng)常將過去舊的內(nèi)容進(jìn)行簡單的翻新,在翻新的過程中,描述、關(guān)鍵詞和標(biāo)題以及內(nèi)容等改動極少,或者就是簡單的偽原創(chuàng),這樣就容易造成網(wǎng)頁相似度高。第二,將其他網(wǎng)站已經(jīng)收錄的內(nèi)容拿過來,進(jìn)行簡單的調(diào)整,比如改變一下標(biāo)題,將段落重新打散,然后發(fā)布到自己網(wǎng)站上,這樣的內(nèi)容雖然和自己網(wǎng)站中的內(nèi)容對比不會存在相似性,但是從互聯(lián)網(wǎng)的角度上對比,那么這種重復(fù)性就會變得十分明顯了。
當(dāng)出現(xiàn)網(wǎng)頁相似度明顯的時候,就需要立刻改變之前的內(nèi)容建設(shè)戰(zhàn)略,否則一旦超過60%這個警戒線,就很容易網(wǎng)站被判定為垃圾網(wǎng)站,從而很難獲得成功。對此可以從下面兩個方面來降低網(wǎng)站內(nèi)容相似度。
第一,盡可能的進(jìn)行原創(chuàng) ,因為原創(chuàng)的內(nèi)容不會存在相似度的問題,而且就算是別的網(wǎng)站被轉(zhuǎn)載,甚至收錄時間超過你,但是經(jīng)過一段時間之后,百度的智能化算法同樣會判定你作為第一原創(chuàng)者,從而給予更高的權(quán)重。
第二,偽原創(chuàng)要進(jìn)行升級 ,畢竟一個網(wǎng)站豐富的內(nèi)容,通過站長個人或者一個小團(tuán)隊往往很難搞的非常豐富,適當(dāng)?shù)膫卧瓌?chuàng)無可厚非,可是偽原創(chuàng)卻需要進(jìn)行升級,不能夠進(jìn)行簡單的更換標(biāo)題,打亂段落的方式,這種方式隨著百度智能化的升級,已經(jīng)很難適應(yīng),最佳的方法就是通過人工改寫的方式,而且盡可能達(dá)到70%以上的原創(chuàng)度,才能夠降低網(wǎng)頁的相似度。
第三,采用iFrame框架技術(shù)對于一些重要內(nèi)容進(jìn)行多次展示, 因為一個網(wǎng)站上的內(nèi)容可能會在多個頻道上展示,比如首頁上具有一些推薦的內(nèi)容,而相應(yīng)的欄目頁上也存在著這些一模一樣的內(nèi)容,那么此時就需要采用iFrame框架技術(shù),對于重復(fù)的內(nèi)容根百度說不,讓百度不要抓取這些內(nèi)容,這樣就能夠規(guī)避網(wǎng)頁相似度的風(fēng)險。
總而言之,網(wǎng)頁相似度不能夠太高,但是一點(diǎn)沒有也不夠現(xiàn)實,關(guān)鍵是掌握一個度,如果站長時間充分,那么盡可能的做好原創(chuàng),再加上對代碼進(jìn)行合理的優(yōu)化,這不僅能夠降低網(wǎng)頁相似度,同時還能夠優(yōu)化對用戶的體驗,起到一箭雙雕的作用。謝謝閱讀,希望能幫到大家,請繼續(xù)關(guān)注腳本之家,我們會努力分享更多優(yōu)秀的文章。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!