關于網(wǎng)站收錄問題,一直是很多站長甚至企業(yè)頭疼的問題,很多人認為網(wǎng)站收錄不收錄是看百度吃飯,也就是百度決定的,這也就導致目前在收錄問題上分為兩派:
一、主動推送百度,就會收錄。
二、收錄確實是百度決定的。
首先我們來說說第一種觀點,第一種觀點主動推送的意思就是各種提交,比如熊掌號提交、主動提交、自動提交(目前已失效),周級提交(目前好像也失效),MIP提交,sitemap提交。
目前測試的結果,其實主動提交、熊掌號天級提交、sitemap提交是有效的,最起碼在數(shù)據(jù)上能顯示出來,在這種觀點基礎上延伸出一個觀點就是,只要有足夠多的蜘蛛,網(wǎng)站一定會收錄。哪怕你文章再垃圾,再差勁,只要有蜘蛛,100%收錄。
另外一個觀點是提交只是收錄的先決條件,提交未必100%收錄,也就是說,就算蜘蛛來了,也未必收錄。
那么我個人是傾向于第二種的,為什么會這么說,我拿一些證據(jù);
我之前有一個網(wǎng)站,提交熊掌號一直不收錄,結果一直反饋給百度,反復提交后,居然收錄了幾條,過一段時間又不收錄了,然后又提交反饋百度,百度回復說我提交的是熊掌號是PC資源,不是移動資源,不收錄是符合預期的,什么意思呢?
比如我一個文章鏈接是www.abc.com/123.html,那么瀏覽器模擬手機后,鏈接變成了www.abc.com/123.html#efdfd,在模擬手機瀏覽后,#后面變成了隨機數(shù)字,這是跟我程序本身有關系。
大部分網(wǎng)站的格式是www.abc.com/123.html,手機是m.abc.com/123.html或者www.abc.com/123.html(PC和移動已做了自適應。)所以這種格式提交熊掌號是沒有任何問題。但我那種情況是極為罕見的,所以百度不收錄,哪怕文章質(zhì)量再好。
但我另外一個朋友也是跟我一模一樣的程序,也就是說,他的網(wǎng)站跟我的情況一模一樣,但是他卻收錄了。
所以我猜測,要么我朋友說謊,要么百度忽悠我,但我個人分析后發(fā)現(xiàn),我朋友既沒有說謊,百度也沒有忽悠我,導致這種情況,只能用一個原因解釋,那就是他的站,還沒有被百度針對,也就是說,百度更新一些算法的時候,還沒有輪到他的網(wǎng)站。
為何我得出這樣的結論,因為每次百度更新的時候,總會有一些網(wǎng)站狀態(tài)沒有變化,一些網(wǎng)站狀態(tài)有變化,有變化的是可以理解為先被百度測試新算法,如果沒問題,慢慢擴大到更多網(wǎng)站,這也符合互聯(lián)網(wǎng)產(chǎn)品一個屬性,先小部分測試,然后擴大。
從這點來看,我個人分析有幾個細節(jié)需要說明,這是我個人的一些分析:
百度搜索后臺(針對百度內(nèi)部員工),應該是機器加人工審核的,網(wǎng)站被搜索后臺應該都做了標記,比如你的網(wǎng)站被特別照顧(或許也就是沙盒狀態(tài)?),所以好像做SEO特別難搞的原因。從反復反饋百度這件事來看,他們會打開你的網(wǎng)站,去分析,然后符合手工點入收錄庫,從產(chǎn)品角度來說,我們來還原這個過程;
百度員工打開你提交的鏈接,符合收錄標準,然后點加入收錄庫,這條鏈接就可以被site出來了,也就是鏈接的狀態(tài)改變了。我用一個原型圖來說明;(只是草圖,別太針對。)
按道理,這些字段其實能對應的上百度站長平臺后臺的一些字段,這里只為了演示,所以錯誤字段請忽略。
如果是這個流程的話,上述一切都能解釋的清楚了,我那些鏈接提交不收錄因為鏈接格式應該不對,所以觸發(fā)一直不收錄,而我不停的提交反饋后,百度分析后加入收錄庫了,接著后面的百度應該發(fā)現(xiàn)我的站的一些問題,所以直接反饋讓我整改。
那么百度反饋都是機器人的說法不準確,應該有人工參與了,只是大部分是機器人,還有百度數(shù)據(jù)那么多,出點BUG是正常的,所以不要太較真。另外很多人太迷信白皮書,我只想說我個人的觀點,百度是說一套做一套的,別太迷信白皮書。
以上只是自己一些憑經(jīng)驗分析,不代表官方表態(tài),歡迎SEO大佬一起來交流。
運營小貼士:如果網(wǎng)站不收錄,可以用瀏覽器模擬手機端,看是否url起了變化。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!