很久之前,你我都曾經(jīng)做過物理題。記得那時(shí)老師經(jīng)常嘮叨,“先認(rèn)真審題,理解題意,然后再想方法,最后再落筆去做”;“審題啊!審題啊!說過幾遍怎么就是不聽,尋思鷹呢?”
理解當(dāng)年老師的良苦用心,歷經(jīng)磨難,你我也都順利結(jié)束了學(xué)業(yè),不必再審題、不必再做題、不必再考試。然而,人生不如意十之八九,你我又再次走上了數(shù)據(jù)分析的道路。
轉(zhuǎn)換為現(xiàn)在的視角。我們做數(shù)據(jù)分析的目的,是為了解決問題,換個(gè)詞,是為了有用啊。那么你做的分析,有用嗎,怎樣做的分析才有用呢?
直接將分析結(jié)果利用,轉(zhuǎn)換為價(jià)值的,是業(yè)務(wù)?;蛟S按照這樣的路線來做分析,更有用。
1、先審題(理解業(yè)務(wù),做為方向)
2、思考方法(分析思路,設(shè)計(jì)分析方案)
3、下筆(選擇分析技術(shù),開始分析)。
可見,套路是和我們當(dāng)年做題一樣的吧,可是,當(dāng)年的物理題也做過了不少,多苦多累我們都熬過去了,為什么到了數(shù)據(jù)分析這里,還是很多問題呢?私以為,做題是一個(gè)人的事,而現(xiàn)在做分析,變成了一個(gè)組織的事,銜接出了問題。
做數(shù)據(jù)分析可能出現(xiàn)的失敗場景:
l 分析結(jié)果就是錯(cuò)的
l 分析結(jié)果是對的,然而并沒有什么卵用,結(jié)果產(chǎn)生不了價(jià)值
l 根據(jù)分析結(jié)果,可以給出建議方向,但是很空洞,無法落地
l 分析結(jié)果對、建議方向也對、也有落地的方案,但是業(yè)務(wù)就是不執(zhí)行
第一種場景比較少見、而后面的幾種場景卻是做數(shù)據(jù)分析的經(jīng)常會碰到。舉個(gè)栗子。
場景a:
公司在6月18號跟著京東一起搞了個(gè)618大促,結(jié)束后業(yè)務(wù)找到老王,說:“老王啊,我們活動(dòng)做完了,給我做個(gè)分析,讓我看看活動(dòng)效果怎么樣?”
老王接到任務(wù)開始收集數(shù)據(jù)、處理數(shù)據(jù)、做模型、畫報(bào)表。最終出來結(jié)論:“我們本次活動(dòng)期間,環(huán)比上周末uv增長了150%,綜合轉(zhuǎn)化率提高了27%,訂單量增長了110%,銷售額增長了85%。其中江蘇省訂單占比最高,達(dá)到了27%。。。。”
業(yè)務(wù):“你要說明什么,是想告訴我活動(dòng)真好,明年還搞618大促嗎?”
此時(shí),老王只能期待他一臉懵逼的表情來萌翻業(yè)務(wù)了。
場景b:業(yè)務(wù):“老王,感覺公司的綜合轉(zhuǎn)化率有點(diǎn)低,你給我做個(gè)分析,看看是什么問題”向來以行動(dòng)力強(qiáng),技術(shù)水平高的老王,結(jié)合大量的訪問數(shù)據(jù)、用戶數(shù)據(jù)、訂單數(shù)據(jù),采用聚類分析算法、主成分分析、相關(guān)行分析等挖掘手段。成功的發(fā)現(xiàn),年齡段在40歲以上的男性群體,綜合轉(zhuǎn)化率超高,平均達(dá)到47%,所以建議業(yè)務(wù),制定拉新策略,提高這一用戶群體的訪問量。整體的轉(zhuǎn)化率就可以上來了。
業(yè)務(wù):“但是這群人,平時(shí)很少上網(wǎng)啊”。
老王再次懵逼。
場景c:
老王:“我做了一個(gè)用戶流失預(yù)警模型,發(fā)現(xiàn)有a類行為特征用戶在注冊后30天左右流失概率最大,有b類行為特征的用戶在40天左右流失概率最大,有c類行為特征的用戶在50天左右流失概率最大,那么我們只需要做一個(gè)精準(zhǔn)的關(guān)懷,針對不同行為特征的用戶,在不同的時(shí)間點(diǎn),推送廣告、或者發(fā)放優(yōu)惠券,就能夠有效的降低流失率”。
業(yè)務(wù):“老王,你說的很對,但是我們公司小,實(shí)現(xiàn)這樣的精準(zhǔn)投放成本太高了,我們現(xiàn)在每天忙成狗,核心的內(nèi)容體驗(yàn)還沒做好,你的建議后面再考慮吧,辛苦了。。。”
老王他已經(jīng)很努力了,但是分析結(jié)果確不盡如人意。
我們常常見到數(shù)據(jù)分析師抱怨:我的工作不夠重視,他們要數(shù)據(jù)的時(shí)候就讓我提取一下,最多做個(gè)簡單的加工;業(yè)務(wù)做決策都不看數(shù)據(jù),全憑經(jīng)驗(yàn)來;業(yè)務(wù)開會,討論方案從來不叫上我,不參考我們的意見。
同時(shí),也能聽到業(yè)務(wù)方的抱怨:數(shù)據(jù)部門提供的結(jié)果,都不是我想要的;數(shù)據(jù)部門太天真,提供的方案太多漏洞;數(shù)據(jù)部門的人都不懂業(yè)務(wù),拿著點(diǎn)數(shù)據(jù)就能來指導(dǎo)我們嗎;
我想,這里就是業(yè)務(wù)與分析之間的銜接出了問題。業(yè)務(wù)不相信數(shù)據(jù),當(dāng)一個(gè)分析結(jié)果與他的設(shè)想不同時(shí),首先就是懷疑數(shù)據(jù),他所做的分析,僅僅是為了驗(yàn)證自己的觀點(diǎn)。
見過數(shù)據(jù)分析做的比較好的公司,一個(gè)是bi經(jīng)理是產(chǎn)品經(jīng)理出身,懂業(yè)務(wù)、懂產(chǎn)品、懂運(yùn)營,所以他帶隊(duì)做的分析項(xiàng)目自然貼合業(yè)務(wù)需求。還有一個(gè)是公司將數(shù)據(jù)化運(yùn)營提升到了很高的高度,培養(yǎng)公司業(yè)務(wù)具有數(shù)據(jù)意識,了解數(shù)據(jù)分析的思路,認(rèn)同數(shù)據(jù)分析的價(jià)值,知道如何利用分析結(jié)果。
可以是數(shù)據(jù)分析師向業(yè)務(wù)多走一步,也可以是業(yè)務(wù)人員向數(shù)據(jù)多走一步,使得兩方面有一定的重疊,做好這個(gè)銜接,數(shù)據(jù)分析可能就會更有用。嗯,你們邁出的這一小步,就是你們公司的一大步。
一方面,培養(yǎng)全公司業(yè)務(wù)的數(shù)據(jù)意識,是需要時(shí)間并且有難度的。另一方面,作為一個(gè)數(shù)據(jù)分析師,也應(yīng)該更多的了解業(yè)務(wù),這樣才能把“業(yè)務(wù)的需求”轉(zhuǎn)化為數(shù)據(jù)需求,再進(jìn)一步把分析結(jié)果轉(zhuǎn)化為有意義、可落地、可產(chǎn)生價(jià)值的方案。同時(shí)也能反過來完善自己的知識體系,提升自身的業(yè)務(wù)理解能力和數(shù)據(jù)分析能力。
問題來了,怎樣去了解業(yè)務(wù)呢,只能說,世上無捷徑,除非你改行。能想到的方法,就是交流交流再交流,當(dāng)業(yè)務(wù)需要分析一個(gè)活動(dòng)效果的時(shí)候,多問一句,你關(guān)心哪些指標(biāo)?哪些參數(shù)會影響一個(gè)活動(dòng)的成效?當(dāng)業(yè)務(wù)要分析轉(zhuǎn)化率的時(shí)候,多問一句,影響轉(zhuǎn)化率的因素有哪些,有哪些方法可以提高轉(zhuǎn)化率。都是一個(gè)公司的,沒事請業(yè)務(wù)吃頓飯,沒有什么是一頓飯解決不了的,如果有,那就兩頓,吃著吃著,不僅你懂了業(yè)務(wù),業(yè)務(wù)也懂你了。
交流,聽起來很簡單,做起來是最難的,尤其大部分?jǐn)?shù)據(jù)分析師都是數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)等這種理工科出身。會有人期待一個(gè)更簡單的方法。例如:數(shù)據(jù)部門只做技術(shù),分析全都交給業(yè)務(wù)部門如何,我們買bi工具,讓業(yè)務(wù)實(shí)現(xiàn)自主分析。你說用bi來節(jié)省工作量降低時(shí)間成本我信,你給bi這么艱巨的任務(wù),且不說bi工具的分析能力有限,無法實(shí)現(xiàn)深度分析和挖掘,業(yè)務(wù)部門的數(shù)據(jù)意識上去了嗎?沒有統(tǒng)籌,各個(gè)業(yè)務(wù)部門的分析結(jié)果相互沖突怎么辦呢?業(yè)務(wù)部門的分析結(jié)果不客觀,對于公司來說,是最好的嗎?
所以,對于一整個(gè)數(shù)據(jù)分析體系而言,工具和技術(shù)只是輔助,業(yè)務(wù)和思路才是核心和重點(diǎn)。談到技術(shù),再進(jìn)入到第二個(gè)銜接點(diǎn)。
互聯(lián)網(wǎng)公司一直處于技術(shù)的前沿,技術(shù)可能都不是問題(如果跟一個(gè)互聯(lián)網(wǎng)公司說你技術(shù)不行,就希望他們公司程序員加班太多打人的力氣都變小了吧),更多的可能是對技術(shù)的選擇。私以為互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)分析需求可以大體上分為三類:
1、業(yè)務(wù)常規(guī)需求,主要是輔助業(yè)務(wù)日常工作用
2、指標(biāo)監(jiān)控與數(shù)據(jù)呈現(xiàn)類,為管理和決策提供支持,也為后面的針對性的挖掘分析提供入口
3、有主題有針對性的挖掘分析,為運(yùn)營、產(chǎn)品的改善提供數(shù)據(jù)依據(jù),具有一定的驅(qū)動(dòng)價(jià)值對于第1類和第2類需求,有用開源報(bào)表的、有用商用報(bào)表的、有用bi的、有寫echart的也有用excel的。對于第三類需求,有用sas的、spss、python的、r的甚至有用c++的。
要說哪一類技術(shù)或工具才是最好的呢,我相信沒有,如何選擇,更多的是要結(jié)合業(yè)務(wù)場景,有時(shí)是多種工具同時(shí)使用,才是最佳的。如何才能做好這一點(diǎn),我想就是要有清晰的分析思路,和熟練的分析技能(對各種工具的了解)。也就是打通第二個(gè)銜接點(diǎn)。
對于很多分析師來說,這一點(diǎn)要比第一個(gè)銜接點(diǎn)容易的多。但是我再多說一點(diǎn)的是,分析手段的選擇,不僅要考慮分析實(shí)現(xiàn)的可行性,也要考慮分析成本,主要的就是時(shí)間成本。R語言現(xiàn)在大量應(yīng)用于互聯(lián)網(wǎng)公司,我想也是因?yàn)樗峁┐罅康慕y(tǒng)計(jì)函數(shù)和算法,降低了數(shù)據(jù)分析成本的原因,當(dāng)然,少不了它開源的巨大優(yōu)勢。
同樣,對于第1類和第2類需求,選擇實(shí)現(xiàn)方案,也要考慮成本。相比較來說,這兩類需求的實(shí)現(xiàn)難度更低,相信對于任何公司來說,也都是并非核心技術(shù)。有堅(jiān)持用excel的,也有堅(jiān)持碼代碼的。當(dāng)然,具體怎樣選擇也要結(jié)合業(yè)務(wù)場景,但是綜合起來看,如果有方法一天就實(shí)現(xiàn),就盡量不要花兩天時(shí)間去開發(fā)。比如有些場景你如果機(jī)智舍去excel,用finereport,甚至相比于開源report或者echart來說,還是節(jié)約一定時(shí)間成本的,省下的程序員,還能打掃打掃衛(wèi)生啊。
以上是我對互聯(lián)網(wǎng)行業(yè)中數(shù)據(jù)分析業(yè)務(wù)的一些淺薄的看法,如有不當(dāng)?shù)牡胤剑瑲g迎批評指正和交流。
原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系知乎作者 jiago王
作者:jiago王
鏈接:
來源:知乎專欄-撩撩數(shù)據(jù)吧
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!