當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

你所不知道的百度推廣審核機制,其實有三道防火墻

 2016-01-29 10:14  來源: 用戶投稿   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

前不久,百度公開數(shù)據(jù)屏蔽3.8億條虛假有害鏈接,處理超過1億個違規(guī)站點,在2014至2015年兩年時間里拒絕了5億條推廣信息,2015年拒絕438300個不良賬戶。

百度經(jīng)常被質(zhì)疑,搜索結(jié)果中存在虛假推廣信息,夸大宣傳等問題,不少人認為只要有錢就能在百度上做推廣,誰出價高就能排在搜索結(jié)果的第一位。而百度推廣確實存在各種問題,如同阿里平臺中始終有假貨存在,在這方面百度責無旁貸。但在道德審判之外,我更為關(guān)心具體的場景細節(jié),到底百度需要面臨怎樣的“騙子橫行”?以及夾在“騙子”與“需求”之間的百度在其中究竟做了什么?每個硬幣都有一體兩面,本文希望能夠通過純粹的技術(shù)視角來重新看百度的另一面。

事件回放

此前,一位前百度高管找到李彥宏,為一家著名投資機構(gòu)旗下的P2P公司說情,希望加入到能夠在百度進行推廣的“P2P網(wǎng)貸平臺白名單”。而說情的原因是因為這家P2P公司的資質(zhì)未能達到百度信譽的評定標準,并被百度拒絕推廣請求,雖然這家P2P公司也獲得了正規(guī)知名機構(gòu)的風險投資,并且這位前高管在百度內(nèi)部有著很多“人脈資源”甚至有直接上達李彥宏的權(quán)力,但百度方面依然表示需要按照百度的信譽V體系來審核,并且最終仍然沒有通過審核。

除此之外,事實上百度還做了大量反詐騙的工作, “網(wǎng)民權(quán)益保障計劃”網(wǎng)站中,百度就對部分詐騙網(wǎng)站進行了曝光。

而這些反詐騙案例得以曝光,都與“百度信譽V體系”有關(guān),如同阿里打假的“神盾局”,“百度信譽V體系”也是百度的防火墻,為什么李彥宏如此信任這道防火墻,甚至可以直接拒絕前高管的請求?

百度信譽V體系,三道防火墻

防火墻

簡單的說百度信譽V體系就是對企業(yè)信譽的評級,百度首先通過這套評級機制來決定企業(yè)是否有資格在百度進行推廣,并且即使已經(jīng)入住的企業(yè),“百度信譽V體系”依然會對其進行持續(xù)性的監(jiān)督,中途一旦發(fā)現(xiàn)違規(guī)就根據(jù)具體情況進行暫停推廣、警告、永久封號、上報公安等等具體措施。

信譽V體系主要依托人工與大數(shù)據(jù)的混合監(jiān)控,在數(shù)據(jù)審查主要分為三層遞進方式,可以看成是三道防火墻。

1)第一道防火墻,百度沒有該企業(yè)數(shù)據(jù),要求資質(zhì)信息

沒有任何一家企業(yè)可以隨意在百度投放推廣信息,根據(jù)每個行業(yè)的審核機制不同,百度會要求提供每個行業(yè)的企業(yè)背景資料和相關(guān)證件,包括公司營業(yè)執(zhí)照原件及營業(yè)執(zhí)照上登記的法定代表人的身份證原件的影印件,以及法定代表人手持自己身份證的肖像照片等等。

百度通過“實名認證、資信認證、商標認證、授權(quán)認證、官網(wǎng)認證、誠企專區(qū)”等六大產(chǎn)品徹底核實企業(yè)身份信息的真實性。

基本的企業(yè)信息審核,這是第一道防火墻。

2)第二道,百度擁有部分該企業(yè)數(shù)據(jù),全網(wǎng)信用建模

只是獲得企業(yè)的給到的信息是遠遠不夠的,這等于博弈的籌碼完全在對方手里,而百度方面也需要自己的籌碼,也就是對方的數(shù)據(jù)信息。百度主要采取了以下數(shù)據(jù)收集的方式對該企業(yè)進行全網(wǎng)的信用建模。

接入政府方面的第三方數(shù)據(jù),通過接入工商信息數(shù)據(jù)、全國個人身份信息數(shù)據(jù)等等相關(guān)部門數(shù)據(jù),通過人工審查,實現(xiàn)100%的信息準確性核實,進而規(guī)避部分地區(qū)工商網(wǎng)站建設落后導致的人工審核受限、無企業(yè)信息可查的問題。其次是通過政府方面的監(jiān)管記錄可以對企業(yè)進行更嚴密的監(jiān)控,下圖以“蘇寧”為例。

監(jiān)控

百度的此類相關(guān)數(shù)據(jù)均來自政府監(jiān)管。

其次通過全網(wǎng)數(shù)據(jù)對其進行建模,百度有著可以對“事件”建模的技術(shù),例如我們搜索“張飛”時百度可以根據(jù)全網(wǎng)的數(shù)據(jù),找出一切與張飛的關(guān)聯(lián)人物,諸如趙云、劉備等等,如圖。

張飛

因此我們繼續(xù)以“蘇寧”舉列,百度會根據(jù)“蘇寧”這個關(guān)鍵詞索引一切關(guān)聯(lián)的大數(shù)據(jù)、諸如“天貓”、"京東"、"家電"、"家電"等等關(guān)鍵詞,進行一個大的品牌建模。其中百度會抽取大數(shù)據(jù)中的諸如“蘇寧電器質(zhì)量怎么樣?”、“蘇寧發(fā)貨速度好快”等等全網(wǎng)的相關(guān)鍵詞搜索信息、媒體網(wǎng)站輿論信息、問答網(wǎng)站信息、百度口碑信息等等多方信息,對其進行一個信譽體系的建模,反向得出其信譽指數(shù)。

也就是說,想要在百度進行推廣的企業(yè),在其入駐百度之前,百度就已經(jīng)有了其相關(guān)的大量數(shù)據(jù)信息,從政府方面提供的信息再到全網(wǎng)的信譽初級指數(shù),凡是能夠有該企業(yè)數(shù)據(jù)的地方百度都會不遺余力的去收集。

因此,即使一個網(wǎng)站給了百度初級的資質(zhì)信息,但只要無法與百度取的的政府信息匹配,以及有著不良的全網(wǎng)信息記錄評級,就不可能被允許投放推廣信息。在這套系統(tǒng)制約下,百度信譽認證體系已封禁企業(yè)達20546家,共封禁194392個推廣賬戶。

3)第三道防火墻,持續(xù)監(jiān)督該企業(yè)數(shù)據(jù),全網(wǎng)追蹤跟進+百度口碑

推廣信息動態(tài)監(jiān)控,上面兩道防火墻都是建立在投放推廣信息之前,而讓百度最為頭疼的則是在投放推廣信息之后,大部分作惡的企業(yè)都是在百度審核之時交給了百度一個正常的網(wǎng)頁,而在百度通過審核之后便通過代碼技術(shù),偷偷換上自己的非法內(nèi)容,瞞天過海,在百度那里原來看到的“正常內(nèi)容”,到了用戶那里就變成了“作惡內(nèi)容”。

舉個例子,一些不法推廣公司會在Flash推廣信息中嵌入第三方外鏈或php腳本內(nèi)容,會根據(jù)IP、時段、設備的不同進行不同的跳轉(zhuǎn),并且還會監(jiān)視百度蜘蛛的抓取技術(shù)躲避百度監(jiān)控,早上同一個鏈接點開可能是正常的鋼材推廣信息,但是到了晚上就變成了色情內(nèi)容,而百度面通過建立程序員組建立Flash信息的代碼解析模塊,24小時監(jiān)控,主動發(fā)現(xiàn)其中“不應出現(xiàn)”的外鏈或php腳本內(nèi)容。

經(jīng)過這么多年的“交手”,百度目前基本已經(jīng)杜絕推廣信息作弊。去年百度共封禁Flash賬戶超1.5萬個,涉及Flash信息數(shù)超570萬條,其中機器拒絕違規(guī)Flash信息通過共近60萬條。

全網(wǎng)數(shù)據(jù)動態(tài)監(jiān)控,“百度信譽V”體系并非永久不變,對于百度來說除了在企業(yè)主推廣之前對其進行全網(wǎng)建模以外,還會持續(xù)跟進對其信譽的評級,一旦在權(quán)威媒體網(wǎng)站或者在關(guān)鍵詞搜索中檢索到其負面內(nèi)容,或者檢測到政府方面對該企業(yè)給予了處罰內(nèi)容,那么企業(yè)信譽則會發(fā)生相應波動,而當波動幅度過大時,百度方面會立即進行人工檢查,并可能立即停止其推廣行為。

百度口碑,該項目是百度內(nèi)部自建項目,通過利用百度用戶的UGC內(nèi)容對各大網(wǎng)站內(nèi)容進行用戶評級,這也是“百度信譽V”體系中的一環(huán)。目前百度口碑中集成了評論、實名曝光、輿情觀察等內(nèi)容。用戶的海量曝光投訴,對“百度信譽V”有著較大的參考價值,以下為百度口碑的實名曝光。

張飛

一些思考

闌夕曾在《百度為什么要“賣”貼吧》一文中說過,由于國外有著極強的政府監(jiān)管以及優(yōu)渥的基礎設施,因此谷歌在投放推廣信息方面并沒有太多后顧之憂,與政府有著涇渭分明的界限。

由于國內(nèi)的監(jiān)管機制、基礎設施都起步較晚,導致原本屬于政府的壓力都轉(zhuǎn)嫁到了互聯(lián)網(wǎng)公司上,而一旦互聯(lián)網(wǎng)公司監(jiān)管不利,公眾對互聯(lián)網(wǎng)公司的憤怒反而大于對政府的憤怒,這里面或許有多少無奈。

此外,在當前的環(huán)境下,無論百度阿里騰訊都無法徹底禁止“作惡者”,百度眼皮底下依然會有鉆空子的作惡者,阿里的平臺上也無法做到完全禁止假貨,而那些以微商之名做“傳銷”的假微商,也還是會對微信不擇手段的利用。

但值得期待的另一面則是,互聯(lián)網(wǎng)公司正在承擔起這些責任,百度成立了“百度信譽V”,拒絕了5億的推廣頻次,自掏近5000萬的理賠費,阿里成立了“神盾局”,一年花費10億用于打假,騰訊也在通過監(jiān)測關(guān)鍵詞禁止一切非法推廣等等。

而這些公司處理的方式都有一個最大的共同點就是—技術(shù),而技術(shù)只對結(jié)果負責,所有一切“作惡”都會被徹底放到放大鏡底下被監(jiān)視,脫離于原來的“人治監(jiān)控”手段,也就可以避免各種因人而導致的不確定的利益勾結(jié)。

因此對于未來,當我們拿起放大鏡去客觀看每一個歷史進程的細節(jié)時,那個真實的世界,一直都在變得更好。

作者微信公眾號:shouxifayanzhe

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
百度推廣

相關(guān)文章

熱門排行

信息推薦