由于百度不會主動抓取https網頁,因而導致了很多https網頁無法被收錄。今日,百度站長平臺就“https站點如何建設才能對百度友好”這一問題發(fā)布了公告,文中闡述了該問題的注意事項、以及應對方案。
詳情如下:
主要可從以下四個方面提高https站點的百度友好度:
1,為需要被百度搜索引擎收錄的https頁面制作http可訪問版。
2,通過user-agent判斷來訪者,將Baiduspider定向到http頁面,普通用戶通過百度搜索引擎訪問該頁面時,通過301重定向至相應的https頁面。如圖所示,上圖為百度收錄的http版本,下圖為用戶點擊后會自動跳入https版本。
3,http版本不是只為首頁制作,其它重要頁面也需要制作http版本,且互相鏈接,切不要出現(xiàn)這種情況:首頁http頁面上的鏈接依然鏈向https頁面,導致Baiduspider無法繼續(xù)抓取——我們曾經遇到這種情況,導致整個網點我們只能收錄一個首頁。
如下面這個做法就是錯誤的:http://www.abc.com/ 鏈向https://www.adc.com/bbs/
4,可以將部分不需要加密的內容,如資訊等使用二級域名承載。比如支付寶站點,核心加密內容放在https上,可以讓Baiduspider直接抓取的內容都放置在二級域名上。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!