<menu id="ycqsw"></menu><nav id="ycqsw"><code id="ycqsw"></code></nav>
<dd id="ycqsw"><menu id="ycqsw"></menu></dd>
  • <nav id="ycqsw"></nav>
    <menu id="ycqsw"><strong id="ycqsw"></strong></menu>
    <xmp id="ycqsw"><nav id="ycqsw"></nav>
  • 數據分析的流程包括哪些(必備的8個主要流程)


    1. 新的需求

    數據分析工作流程的第 1 個狀態,就是忠實地記錄新的需求,純粹地站在需求方的角度,不加任何評判地收集原始的需求。

    這個狀態借鑒了 ORID 焦點討論法的第 1 步,也就是真實地記錄客觀的事實。

    關于 ORID 焦點討論法,我從網上查了一些相關資料,看到下面這個例子,感覺比較恰當。假設昨天晚上在下班的路上,我遇到一條狗(O 事實),當時我很害怕(R 感受),心想應該怎么辦(I 思考),為了避免被狗咬,我最終決定繞路走(D 決定)。

    數據分析的 8 個工作流程

    2. 需求確認

    需求確認是分析任務成敗的關鍵,針對不同的情況,應該采取不同的對策。

    第 1 種情況:需求方無法清楚描述問題。

    劉思喆老師說,這類需求方的專業技能不合格,會禍害上下游,「fire」掉就可以了,絕對不可以手軟。

    關于「fire」這個英文單詞,有「開除」的意思,不過我理解劉思喆老師在這里表達的應該是「拒絕」。

    對于一般的數據分析師而言,需求方可能就是自己的老板,恐怕沒有「開除」的勇氣。遇到這種情況,我個人建議加強溝通交流,主動多問一問具體情況,搞清楚需求方的真正意圖。

    第 2 種情況:需求方將很多問題混雜在一起。

    這種情況非常普遍,數據分析師需要應用 MECE 原則,幫助需求方梳理業務,變成相互獨立、完全窮盡的問題,并了解其中的主要矛盾和次要矛盾。

    第 3 種情況:需求方無法和數據進行映射。

    這種情況也相對比較普遍,一般企業是通過「角色前置」來緩解這個問題,比如設置「產品經理」的崗位角色。不過有的時候,前置的角色可能不合格,這就需要數據分析師在「數據確認」環節給予專業的建議。

    第 4 種情況:需求方提出了錯誤的數據需求。

    想象一下,數據需求本身就不對,你作為數據分析師,居然漂亮地執行完成了……結果需求方不滿意,又提了一遍,后面可能還有第三遍……最終需求方可能很不滿意,數據分析師吃啞巴虧。

    當出現這種情況時,建議數據分析師在執行之前,先進行合理的溝通,指出數據需求本身的不當之處。

    第 5 種情況:需求方無法預判可能的分析結果。

    這種情況很正常,畢竟很難碰到非常完美的需求方。我認為此時數據分析師應該多一些包容和理解,多站在對方的角度看問題,自己先學會預判,然后再幫助對方學會預判,為對方排憂解難。

    假如遇到需求方不僅掌握業務和數據之間的關系,而且懂得利用數據分析的結果,來指導下一步的行動,那么數據分析師應該好好珍惜。

    3. 數據確認

    當需求確認清楚之后,接下來需要確認數據源,可能會遇到 3 個問題。

    第 1 個問題:期望的數據沒有存儲。

    作為數據分析師,如果你能幫助改善這個問題,讓企業的數據更加完備,那么你的影響力將會得到提升。

    第 2 個問題:數據分散在不同的位置。

    在傳統企業,這個問題非常普遍,可能還沒有建立數據倉庫。對于互聯網企業,這個問題體現了數據倉庫設計的不完備。

    如果不是經常性的問題,臨時解決即可。如果是經常性的問題,建議數據分析師主動了解底層的數據邏輯,編寫自動化的代碼,在可能的情況下,交付給數據倉庫團隊。

    第 3 個問題:數據源錯誤。

    這個問題非常致命,如果數據源不對,后面的分析結果可能造成誤導,讓需求方做出錯誤決策,后果不堪設想。

    所以,數據分析師提高數據敏感度也很重要,在做數據分析之前,一定要先確認一下,數據源是正確無誤的嗎?

    4. 實現中

    在需求實現的過程中,數據分析師要管理好自己的分析代碼。

    以 Python 為例,盡量使用 Numpy、Pandas、Matplotlib 等比較成熟的包,用 Git 做好代碼的版本控制,特別注意代碼注釋和提交信息的可讀性和完整性,讓數據處理的每個步驟都清晰易懂。

    另外,配合使用 Jupyter Lab 之類的工具,能大大提升數據分析的工作效率。

    一方面,我們要把好的經驗和方法,沉淀為固定的流程步驟,實現工作的流程化。比如一個數據報表,用怎樣的格式和規范,讀者容易抓住其中最有價值的信息?

    另一方面,我們還要實現流程的工具化。因為總有人會「偷懶」,總有人會逾越流程,總有人會偷偷地繞過流程。所以,我們要適應用工具來輔助流程的執行。

    如果流程工具用起來不適應,怎么辦?

    華為早年引入集成產品開發 (簡稱 IPD)的流程,大家剛開始也不適應。

    任正非說了一句話:先僵化、后優化、再固化。

    5. 交付

    突出主要分析結論,這是數據分析交付的重要內容。

    如果分析沒有結論,就不能稱之為交付。

    交付的內容,包括文字、表格、圖形等要素。文字表述要條理清晰,表格制作要標準規范,數據可視化的圖形要選擇合理。

    數據分析的 8 個工作流程

    6. 復盤

    很多數據分析工作,最終停留在「交付」這個狀態,數據分析師交付結果之后,往往沒有去跟進后續的效果情況,沒有對分析的價值進行判斷,沒有進行復盤總結。

    交付之后,不妨思考一下,我們通過數據分析,幫助需求方做出了哪些正確的決策?給企業帶來了哪些價值?與當初預期的目標相差多少?關鍵因素有哪些?假如重新再做一遍,怎么做才能做得更好?

    在復盤總結的過程中,可以鍛煉數據分析師對業務的理解能力和對價值的預判能力。

    7. 等待

    當你發現目前還不具備分析的條件時,那么可以選擇等待一下。

    比如說,當需求還沒有確認清楚的時候,應該等待需求方有空的時候,把需求溝通確認清楚。當缺少必要的數據源時,因為巧婦難為無米之炊,所以也需要耐心等待。

    當然,在等待的時候,可以先思考一下大致的分析方向,以便讓后面的實現過程更加快捷。

    8. 拒絕

    當需求肯定無法實現的時候,要明確地予以拒絕,不要給人模棱兩可的答復,此時要避免讓需求方有很大的期待,結果因實現不了而導致失望。

    小結

    本文總結了數據分析工作流程的 8 個狀態,

    為了避免被貼上被動、低價值、重復勞動的標簽,數據分析師要主動完善自己的工作流程,優化自己的工作狀態。

    最后,我把數據分析的 8 個狀態之間的流轉,用一張流程圖串聯了起來。

    數據分析的 8 個工作流程

    以上,希望能夠對你有所啟發。

    版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 舉報,一經查實,本站將立刻刪除。

    發表評論

    登錄后才能評論
    国产精品区一区二区免费