「陳佼觀點」可以說PageRank成就了Google,與之類似的算法體系也成就了全球最出色的幾個搜索引擎。但是任何事物都會有其生命周期,PageRank也不例外。而且作為搜索巨頭的谷歌,它自己也在不斷反思研究,也許未來PageRank依然存在,但其實內(nèi)涵將徹底變化。
不是我危言聳聽,說“PageRank過時”或者“不科學”,早就有相關(guān)的言論和分析了。具體大家可以參考一下題為“PageRank行將過時搜索引擎遭遇范式轉(zhuǎn)移”的文章,其中從技術(shù)的角度闡述了PageRank的種種局限。
在過去10多年,可以說PageRank成就了Google,與之類似的算法體系也成就了全球最出色的幾個搜索引擎。但是任何事物都會有其生命周期,PageRank也不例外。而且作為搜索巨頭的谷歌,它自己也在不斷反思研究,也許未來PageRank依然存在,但其實內(nèi)涵將徹底變化。
為什么PageRank將越來越過時?
我們來看一下,PageRank算法的基本規(guī)則是:某個網(wǎng)頁被鏈接得越多,則該網(wǎng)頁的等級和重要性越大,從而在相關(guān)性排序中也就越靠前。當然,傳統(tǒng)搜索還有很多排序規(guī)則來輔助PageRank,讓其精準性得到進一步提高。
我曾請教過搜狗的CEO王小川,他提到,為什么Google要做Chrome?拋開云計算、操作系統(tǒng)等戰(zhàn)略考慮,其中一個很重要的原因在于,利用瀏覽器可以分析用戶對網(wǎng)站的訪問行為,從而對PageRank規(guī)則形成補充。因為PageRank只管網(wǎng)頁鏈接的情況,卻不關(guān)心用戶的真正點擊行為。
這個小例子可以證明PageRank的過時,或者說起碼它不完善。但這并不是PageRank的致命傷,它的真正問題在于——它只考慮了網(wǎng)站自身的權(quán)重,而不關(guān)心關(guān)鍵詞提交者的意圖和所處的狀況。
我舉個簡單的例子:同樣檢索“非誠勿擾”,PageRank會根據(jù)自己的算法給出網(wǎng)頁權(quán)威度的一個排序結(jié)果。但實際上網(wǎng)友的需求可能是檢索“費城(非誠)勿擾”相親節(jié)目,也可能是電影??赡苡腥艘f,這應該是語義分析應該做的事,PageRank只是根據(jù)鏈接關(guān)系進行排序,但兩者很難徹底割裂看來,更合適是的是根據(jù)不同主題給出不同的重要度排序,現(xiàn)在也有這方面的改進和嘗試。隨著人類對信息獲取需求的提高,搜索會越來越聰明,需要考慮更多越來越多的因素。
情境搜索的興起
最近Google第一次提到了“情境”這個詞,具體技術(shù)是“情境發(fā)現(xiàn)”(contextual discovery),據(jù)說2011年會有應用上線。 “情境發(fā)現(xiàn)”從本質(zhì)上,就是在搜索中,加入更多“人”的因素——用戶的瀏覽習慣、所處的地理位置等,搜索方式也會有新的變革,比如主動推送。顯然,Google已意識到這個問題。
Facebook興起后,被視為Google的顛覆者。顛覆Google,不是因為Facebook流量已實現(xiàn)超越,而是Facebook對人的了解將遠遠超過Google.這對Google未來的搜索戰(zhàn)略是極大的障礙。所以Google十分重視社交網(wǎng)絡(luò),在我看來,這并非Google覬覦社交網(wǎng)站,而更多是出于一種自衛(wèi)。
而中國的Facebook騰訊從2009年就提出了“情境搜索”概念,和Google的“情境發(fā)現(xiàn)”頗有異曲同工之妙。到目前,基于這一概念的應用已經(jīng)上線了一些應用,比如針對QQ表情的“表情搜索”,再比如你在和好友聊“非誠勿擾2”,觸發(fā)搜索后即是電影介紹、預告片、影評、播放影院等,甚至還將包括在線預訂、購買等后續(xù)服務。
這顯然和PageRank體系的核心有很大區(qū)別。決定搜索結(jié)果及排序的規(guī)則,多出了很多維度,比如上下文關(guān)聯(lián)、瀏覽習慣、搜索者所處的“情境”等。微軟公司一直在研究一種叫“BrowserRank”的算法,其思路也是引入更多維的衡量模型,比如將用戶在網(wǎng)站停留的時間作為考量標準之一。實際上,類似這種BrowserRank算法在騰訊等公司也早已經(jīng)在應用了。
誰能在情境搜索中勝出?
由此可見,隨著情境搜索時代的來臨,“人”的因素將在搜索技術(shù)中占據(jù)越來越高的比重。從騰訊對情境搜索的實踐可以看出,它強調(diào)以人(Who)為本,根據(jù)其搜索行為的“時間”(When)、地點(Where)、輸入(What)、需求(Want)、習慣(How)、背景(Why)等因素,得到最貼切的搜索結(jié)果。
換句話說,搜索服務商對“人”了解越深刻、對其所處的環(huán)境了解越透徹,則其越能在情境搜索中占據(jù)主動。顯然,擁有最海量用戶群、最長停留時間、最深的互動關(guān)系的平臺將在其中擁有天時地利,這也是Facebook、騰訊這樣的平臺未來的最大機會。
以騰訊為例,其在情境搜索方面的主要優(yōu)勢在于:幾乎100%的網(wǎng)民覆蓋,這將為情境計算模型的建立提供基礎(chǔ);騰訊平臺基于“在線生活”的定位,這能讓“情境”的展現(xiàn)變得完整,衍生出更智能的搜索方式;此外,移動平臺是情境搜索的重要應用領(lǐng)域,對于擁有龐大客戶端和多年移動布局的騰訊來說,如魚得水。
Google曾經(jīng)也希望用戶“找到信息,然后快速離開”,這句話在未來一定是謬論,所以Google也在通過iGoogle等手段將用戶留下來,為未來的搜索演變做儲備。值得注意的是,“情境搜索”畢竟還處于初級階段,更像是一種“搜索概念”,從傳統(tǒng)搜索到它的演變過程將是緩慢、遞進的過程。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!