可视化+数据+图表,报告规范这么写才能升职
在數據分析中,無論數據收集的過程多么科學,處理多精細、分析方法多么高深,如果不能將它們有效地組織和展現出來、對業務賦能,那么數據分析的價值就無法體現。今天看到了這篇來自趣店技術團隊分享的文章,分享給大家一起學習,建議讀完全文。
一、結構規范及寫作
報告常用結構:
?
1. 架構清晰、主次分明
數據分析報告要有一個清晰的架構,層次分明能降低閱讀成本,有助于信息的傳達。雖然不同類型的分析報告有其適用的呈現方式,但總的來說作為議論文的一種,大部分的分析報告還是適用總-分-(總) 的結構。
?
推薦學習金字塔原理,中心思想明確,結論先行,以上統下,歸類分組,邏輯遞進。行文結構先重要后次要,先全局后細節,先結論后原因,先結果后過程。對于不太重要的內容點到即止,舍棄細枝末節與主題不相關的東西。
2. 核心結論先行、有邏輯有依據
結論求精不求多。大部分情況下,數據分析是為了發現問題,一份分析報告如果能有一個最重要的結論就已經達到目的。精簡的結論能降低閱讀者的閱讀門檻,相反太繁瑣、有問題的結論100個=0。報告要圍繞分析的背景和目的以及要解決的問題,給出明確的答案和清晰的結論;相反,結論或主題太多會讓人不知所云,不知道要表達什么。
上面講了報告的寫作原則,舉個例子,參考艾瑞網,《留存與未來-疫情背后的互聯網發展趨勢報告》:
?
二、數據使用及圖表
數據分析往往是80%的數據處理,20%的分析。大部分時候,收集和處理數據確實會占據很多時間,最后才在正確數據的基礎上做分析,既然一切都是為了找到正確的結論,那么保證數據準確就顯得格外重要,否則一切努力都是誤導別人。
1. 分析需要基于可靠的數據源
用于鑒別信息/數據的可靠性,主要有四種方法:同類對比、狹義/廣義比對、相關對比和演繹歸謬。
同類對比:與口徑相同或相近,但來源不同的信息進行對比。
示例:最常見的就是把跑出來的數據和報表數據核對校驗。
?
狹義/廣義對比:通過與更廣義(被包含)或更狹義(包含)的信息進行對比。
示例:3C品類銷售額與商城總銷售額比較,3C的銷售額更高顯然是錯誤的,因為商城總銷售額包含3C銷售額;某些頁面/頻道的UV與APP總UV比較也類似。?
?
相關對比:通過與具有相關性、關聯性的信息進行對比。
示例:某平臺的Dn留存率,對于同一個基準日期來說,D60留存率一定低于D30留存率的,如果出現大于的情況,那就是錯誤數據了。
?
演繹歸謬:通過對現有證據的深入演繹,推導出結果,判斷結果是否合理。
示例:比如某平臺的銷售客單價2000左右,總銷售額1億左右;計算得出當日交易用戶數10萬,通過乘以客單價,得到當天銷售額2億,顯然與業務體量不符,為錯誤的數據。
2. 盡量圖表化,提高可讀性
用圖表代替大量堆砌的數字,有助于閱讀者更形象直觀地看清楚問題和結論,當然,圖表也不要太多,過多的圖表一樣會讓人無所適從。
讓圖表五臟俱全,一張圖必須包含完整的元素,才能讓閱讀者一目了然。標題、圖例、單位、腳注、資料來源這些圖表元素就好比圖表的五臟六腑。
要注意的條條框框。
- 首先,避免生出無意義的圖表。決定做不做圖的唯一標準就是能否幫助你有效地表達信息。
- 第二,不要把圖表撐破。最好一張圖表反映一個觀點,突出重點,讓讀者迅速捕捉到核心思想。
- 第三,只選對的,不選復雜的。
- 第四,一句話標題。
常見的圖表類型選擇:
?
3、警惕圖表說謊
虛張聲勢的增長:人們喜歡研究一條線的發展趨勢,例如股市、房價、銷售額的增長趨勢,有時候為了吸引讀者故意夸大變化趨勢,如圖1通過截斷數軸夸大增長速度,從正常數軸的圖2看到增長是緩慢的。
?
3D效果的偽裝:3D圖形容易造成視覺偏差,如圖1有3D效果,看上去 A->B->C->D->E依次遞增,實際是D>E,要格外小心圖表的偽裝。
?
三、常見數據分析誤區
“用數據說話”,已經成為一種流行語。
在很多人的心里,數據就代表著科學,科學就意味著真相?!皵祿粫_人”,也成了說服別人時常用的口頭禪,事實果真如此嗎?讓我們來談談那些常見的誤區。
1. 控制變量謬誤
在做A/B測試時沒有控制好變量,導致測試結果不能反映實驗結果?;蛘咴谶M行數據對比時,兩個指標沒有可比性。舉個例子,為測試不同營銷時間點對下的轉化的影響,但A實驗使用短信營銷、B實驗使用電話營銷,未控制變量(營銷方式),導致實驗無法得出結論。
2. 樣本謬誤
(1)樣本量不夠
統計學的基礎理論基石之一就是大數定律,只有當數據量達到一定程度后,才能反映出特定的規律。如果出現樣本量極少的情況,建議把時間線拉長,獲得足量的樣本?;蛘邔⒉恢匾南薅l件去掉,增加樣本數。
(2)存在選擇性偏見或者幸存者偏見
統計學的另一大理論基石是中心極限定理。簡單描述就是,總體樣本中,任意一個群體樣本的平均值,都會圍繞在這個群體的整體平均值周圍。
舉個例子,在應用升級期間,衡量登錄用戶數、交易用戶數等指標,來判斷用戶對新版本的喜歡是否優于老版本。聽上去非常合理,但這里實際就隱藏了選擇性偏見,因為新版本發布時,第一批升級上來的用戶往往就是最活躍的用戶,往往這批用戶的指標較好,但不代表新版本更好。
(3)混入臟數據
這種數據的破壞性比較大,可能得出錯誤的結論。通常我們會采用數據校驗的手段,屏蔽掉校驗失敗的數據。同時,在分析具體業務時,也要針對特定業務,對所使用的數據進行合理性限定,過濾掉異常離群值,來確保擁有比較好的數據質量。
3. 因果相關謬誤
會誤把相關當因果,忽略中介變量。比如,有人發現雪糕的銷量和河溪溺死的兒童數量呈明顯相關,就下令削減雪糕銷量。其實可能只是因為這兩者都是發生在天氣炎熱的夏天。天氣炎熱,購買雪糕的人就越多,而去河里游泳的人也顯著增多。
4. 辛普森悖論
簡單來說,就是在兩個相差較多的分組數據相加時,在分組比較中都占優勢的一方,會在總評中反而是失勢的一方。
?
5. 個人認知謬誤
主觀臆斷、經驗當事實、個體當整體、特征當全貌、眼見當事實。
舉個主觀臆斷的例子:某個產品A頁面到B頁面的轉化率30%,直接判斷為很低,推導出可以提高到75%。但實際類似產品或者用戶行為決定頁面的轉化率就只有這么高,得出一個錯誤的結論。
標準至關重要,數據+標準=判斷。有了判斷才能深入分析。通過分組對比找標準(象限法、多維法、二八法、對比法),有標準通過分析對比,找到“好/壞”的點。
統計學規律和理論不會錯,犯錯的是使用它的人。因此,我們在進行數據分析時,一定要格外小心,錯誤的數據,披上科學的外衣,就很難分辨了。
總結
以上是生活随笔為你收集整理的可视化+数据+图表,报告规范这么写才能升职的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据分析师想收入翻倍,不懂点时间管理怎么
- 下一篇: 突破技术界限,FVS大屏编辑模式,真正让