搜索引擎的基本工作原理包括:互聯(lián)網中發(fā)現(xiàn)、搜集網頁信息;同時對信息進行提取和組織建立索引庫;再由檢索器根據(jù)用戶輸入的查詢關鍵字,在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,并將查詢結果返回給用戶。
1、爬行,搜索引擎就是通過特定規(guī)則的軟件來跟蹤網頁鏈接,從一個鏈接爬到另一個。
2、抓取存儲,搜索引擎就是爬蟲搜索網頁,找到網頁中的其他鏈接地址,然后根據(jù)這些鏈接地址搜索下一頁,直到抓取完該網站的所有網頁。若將整個因特網看作一個網站,則網絡蜘蛛可以利用這一原理抓取因特網上所有的網頁,被抓取的網頁稱為網頁快照。
3、數(shù)據(jù)庫處理,將抓取到的網頁放到數(shù)據(jù)庫中。
4、排名,用戶在搜索框中輸入關鍵字后,排名程序調用索引庫數(shù)據(jù),計算排名顯示給用戶,排名過程直接與用戶交互。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!