站長,在做網(wǎng)站的時(shí)候,時(shí)有發(fā)生網(wǎng)站內(nèi)容被采集的情況,特別是現(xiàn)在這種采集成本極低的環(huán)境,只要稍微會一點(diǎn)代碼,就可以制作采集模塊。即便不會代碼,也可以花費(fèi)低廉的價(jià)格去找人代寫。
新站上線,勤勤懇懇的做著原創(chuàng)內(nèi)容,卻被突如其來的采集工具采集了整站。換誰也受不了。
并且,新站開始是沒有權(quán)重的,即使你發(fā)布的是你的原創(chuàng),權(quán)重高的網(wǎng)站采集了你的文章并發(fā)布,蜘蛛爬取網(wǎng)頁,也優(yōu)先收錄了權(quán)重高的網(wǎng)頁,并且認(rèn)為這是他的原創(chuàng)文章。
這就是典型的為他人做嫁衣。
雖然現(xiàn)在文章也有版權(quán)保護(hù),但是在面對采集站點(diǎn)而言,又有什么用呢,既然他敢采集,就不怕你去維權(quán),而且當(dāng)下維權(quán)的成本又高。
以前熊掌號有一個(gè)原創(chuàng)保護(hù)功能,但是因?yàn)榘俣葮I(yè)務(wù)原因,給下線了?,F(xiàn)在的原創(chuàng)真的無法保護(hù)。
所以今天五車二為大家分享幾方法,最大限度的保證自己的創(chuàng)作不被采集。
內(nèi)容優(yōu)化篇
1,寫作的時(shí)候,在你的作品中插入相關(guān)的品牌詞。如:“XXX網(wǎng)小編”,“XXX提醒大家”……或者使用替代詞,百度知道替代為Baidu知道,擺渡知道,百度了解等。為文章打上標(biāo)記,以便在后期的時(shí)候反饋?zhàn)鳛樽C據(jù)使用。
當(dāng)然采集軟件也有過濾功能,所以可以每篇文章都用不同的詞匯。雖然累一點(diǎn),不過有些采集者比較不傷心,總會漏掉一些細(xì)節(jié)。
2,圖片水印處理,采集工具是無法識別圖片并過濾的。原創(chuàng)文章的用圖,可以使用水印。即便采集了,他如果要處理,也要重新編輯。
更新技巧(技術(shù)層)篇
采集者,會讓工具通過網(wǎng)站的URL來識別最新文章。只要我不把最新的文章發(fā)布出去,采集工具就無法獲取到相關(guān)代碼。只要我的文章先行收錄,他在做采集,也會被搜索引擎判定是復(fù)制轉(zhuǎn)載,而非原創(chuàng)。
1,隱藏式更新(延時(shí)) ,自己站內(nèi)的蜘蛛會爬取站內(nèi)的所有URL連接,采集工具不能。所以只要我們將一個(gè)頁面隱藏而不放進(jìn)某一個(gè)分類,等待收錄之后在移入分類。就可以避免第一時(shí)間被采集。
2,程序限制頁面訪問(多少時(shí)間只能訪問多少個(gè)) ,機(jī)器的速度比人快,一個(gè)人不可能在3分鐘內(nèi)訪問每一個(gè)分類的每一篇文章,并且每個(gè)文章都打開。(注意:某些采集工具是可以做到延時(shí)采集的,因?yàn)樗部梢栽O(shè)定幾分鐘訪問一篇。但這需要成本。 )
3,限制面向用戶的頁面展示 ,比如,我只給你展示1頁,第二頁進(jìn)行驗(yàn)證。
4,驗(yàn)證機(jī)制 ,其實(shí)有些網(wǎng)站,是可以做到當(dāng)用戶不正常訪問的時(shí)候就彈出驗(yàn)證碼框來進(jìn)行人機(jī)校驗(yàn),也可以規(guī)避采集工具的采集。
5,鏈接盡量不要有序化 ,采集工具的原來,是通過源碼來進(jìn)行URL識別,一些有序的URL鏈接對于采集者非常喜歡,因?yàn)椴宦闊?,可以采集整站?shù)據(jù)。星空站長網(wǎng),就是xingkongweb.com/1.html,工具甚至可以不進(jìn)入分類,而直接采集文章1-99999.html即可。所以這是一種不好的URL設(shè)計(jì)習(xí)慣。
百度站長工具篇
百度站長工具可以手動提交鏈接。
結(jié)合上面的【技術(shù)層】篇章中的第1點(diǎn),我們先延時(shí)更新,把頁面隱藏起來。
然后利用百度的站長工具,收錄提交,提交了我們原創(chuàng)文章的URL,然后靜待百度收錄之后。
再將文章更新到首頁或分類。
以上就是星空站長網(wǎng)(https://www.xingkongweb.com)五車二給各位站長朋友分享的防護(hù)經(jīng)驗(yàn),希望對大家有幫助,并且讓創(chuàng)作越來越有動力。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!