详解数据可视化的4种类型:手把手教你正确选择图表
導讀:了解可視化任務落在哪個象限有助于我們對要使用的可視化形式、需要的時間以及需要的技能做出準確的判斷。
作者:斯科特·貝里納托(Scott Berinato)
來源:大數據DT(ID:hzdashuju)
將性質和目的這兩個問題的答案整合在一個經典的2×2矩陣中,就得到了四種可視化類型。
讓我們從這個2×2矩陣的左上角開始,按逆時針方向進行說明。
01 觀點說明類
也可以稱之為“咨詢顧問象限”,因為咨詢顧問們對此類圖表的迷戀常常造成流程圖和周期圖的過度使用,有時于表達無益,反而有害。(《哈佛商業評論》(Harvard Business Review)的一位編輯嘉丁娜·莫爾斯(Gardiner Morse)為這類過于煩瑣的圖表創造了一個術語:“廢話圈”(crap circles)。)
概念型、陳述性圖表利用人們對隱喻(樹狀圖,橋形圖)和簡單慣例(圈子,層級)的理解,可以極大地簡化復雜的概念。組織圖、決策樹和周期圖都是觀點說明類圖表的經典示例。作為本文內容框架的2×2矩陣圖也屬于此類。
觀點說明類圖表的設計應清晰而簡單,但大部分此類圖表往往缺乏這樣的特點。它們不受限于數軸也無須考慮如何將數據繪制精確,但對隱喻的依賴常常導致為了強化象征義而加入許多不必要的裝飾。例如,你要介紹的概念是“漏斗式客戶”,你可能會不假思索地在圖表中放一個真正的漏斗圖片,但這種平實的手法可能導致失敗的圖表設計。
因為數據本身不具備觀點說明的功能,圖表說明觀點的能力必須由我們賦予:關注圖表的結構和觀點的邏輯,關注圖表是否足夠清晰——這些之于圖表的重要性,類似文本編輯之于稿件——將作者的創意以最清晰、最簡明的形式表達出來。
比如,一家公司聘請了兩位咨詢顧問,幫助研發團隊從其他行業中尋找靈感,兩位顧問打算使用一種叫作金字塔搜索的方法。但是金字塔搜索是如何進行的呢?顧問們要先給研發部門的負責人講清楚。于是,他們拿出了這樣一幅圖:
這個觀點說明圖表的問題在于設計過度:漸變色、帶陰影的箭頭以及分層的3D金字塔將我們的注意力從圖表觀點吸引到了圖表的裝飾元素——這種風格不可取。
此外,他們并沒有將隱喻描述清楚。他們要講的是金字塔搜索,但圖中最突出的卻是相扣的環;金字塔只是圖像,起不到什么作用。這種做法令人困惑。他們也沒有利用高度差來表明相對地位,而是將專家和頂級專家置于同一水平線上(放在圖的底部——金字塔的象征義又一次沒體現出來)。
他們最好呈現這樣的圖:
▲資料來源:MARION POETZ AND REINHARD PRüGL-JOURNAL OF PRODUCT INNOVATION MANAGEMENT
上圖中,金字塔的象征意義與視覺效果吻合。更重要的是,兩個坐標軸的使用符合慣例,讓讀者能夠立即理解——行業依相關度由近及遠沿x軸排列,專業程度由低到高沿y軸排列。金字塔的形狀起到了作用,表明了頂級專家與其他專家相比的稀缺程度。
標題的用詞也很有幫助——“攀登”和“金字塔”兩個詞都能幫助我們快速抓住圖表的含義。并且,圖也沒有被裝飾元素裹挾:金字塔既沒有做成3D的,也沒有使用砂巖色,更沒有以沙漠為背景。
02 觀點生成類
對許多人來說,這個類型是最難理解的。我們什么時候會需要對非數據型信息進行可視化來尋找觀點?厘清復雜概念與探索性工作似乎是背道而馳的兩個目標,因為在探索過程中,觀點本身還不甚明確。
這類圖表的使用情境和演示媒介有別于其他三種可視化類型,管理者可能沒有把它當成可視化,卻經常用到它。它被畫在白板上,包生肉的油紙上,或者更多地,在餐巾紙的背面。
同觀點說明類圖表一樣,觀點生成類圖表也依賴概念性的隱喻和慣例,但它發生的情境更加非正式,如非工作場合會議、戰略會議和創新項目的前期會議等。此類任務多為解決非數據性的挑戰:組織重構,新的業務流程,決策系統編排等。
對觀點的探索可以由一個人獨立完成,但合作好處更多。圖表設計的過程對觀點探索也會有幫助:收集盡可能多的不同觀點和可視化方法,然后再決定采納哪一個進行后期優化。
喬恩·科爾科(Jon Kolko)是奧斯汀設計中心(Austin Center for Design)的創始人兼負責人,也是《精心設計:如何利用同理心創造人們喜歡的產品》(Well-Designed: How to Use Empathy to Create Products People Love)一書的作者,他的辦公室里面掛滿了畫著概念型、探索性可視化圖表的白板。
“分析復雜問題時,這是個屢試不爽的方法。”他說,“這些手繪稿幫助我們走出模糊和泥濘,最終到達了清晰的狀態。”那些擅長領導團隊、建導頭腦風暴和捕捉創造性思維的管理者,會在觀點生成類象限做得很好。
想象一個營銷團隊正在進行一個非工作場合會議。團隊成員們要找到一個方法,向管理層提出和展示進軍高端市場的戰略提案。一個小時的白板會議產生了多個闡述過渡策略的觀點和方法,并悉數得以保留。但最終,只有一種方法獲得了整個團隊的認同,他們認為這種方式最好地抓住了戰略的關鍵:爭取更少的客戶,讓他們花更多的錢。
上方展示了這場觀點生成會議結束時白板上的草圖。當然,從觀點探索過程中得到的可視化圖表,往往會變成一個更正式且具備展示性的觀點說明類圖表。
03 可視化發掘
這是最復雜的可視化類型,因為事實上,它是兩個類別的結合。回想我們之前根據圖表目的將可視化任務分為三種可能的類型:陳述性的,證實性的,探索性的。但我沒有將證實性可視化列入2×2矩陣之內,為的是保持基本框架的簡單和清楚。
現在,我們的焦點來到了這個象限,我將把證實性這個類型也加入講解的過程,見下方調整后的2×2矩陣。
請注意,證實性可視化僅適用于數據型圖表。沒有數據,一個假設無法被證實或證偽。
此外,證實性和探索性的區分是以虛線顯示的,因為這是一個軟性的區分。證實就是有針對性的探索,而真正的探索更加開放。數據集越大,越復雜,你所知越少,任務的探索性程度就越高。如果將證實比作步行于一條新的路線,探索則無異于開辟一條全新路線。
1. 可視化證實
這一類可視化任務,一定會回答以下兩個問題中的其一:
我認為正確的觀點究竟是否正確?
是否有其他方式來理解這個問題?
這類可視化任務的數據量往往不會特別大,形式以常規圖表為主。當然,如果你想嘗試新的可視化形式,也可以大膽用一些不常見的圖表形式。
證實的使用情境大多是非正式場合,它是正式演示之前為找到合適的圖表形式而做的準備工作。這就意味著你可以把花在圖表外觀設計上的時間省下來,花在圖表的原型設計上。原型設計讓你能夠迭代數據,并快速進行可視化與再可視化。
假設某公司負責員工差旅服務的經理想研究公司購買的機票是否物有所值,她本著“舒適性會隨著機票費用的增加而提高”的假設開始了可視化證實工作。她搜集了經濟艙和商務艙數據,以票價與舒適度為坐標軸,迅速生成了一個散點圖。她的預期是:兩者間存在相關關系,散點呈現向右上方傾斜的趨勢。
請注意,上圖就是一個圖表原型。這位管理者并未花多少時間打磨設計,調整數軸或標題。對這位管理者而言,驗證假設是否正確比讓圖表看起來漂亮重要得多。
她立即發現,票價和舒適度之間的相關性是相對較弱的。對商務艙旅客而言,舒適度有隨票價上升的趨勢,但并不明顯。她很吃驚于假設的不成立:花高價買機票可能并不值得。于是,她開始思考,在做具體決策之前,還需要對哪些假設進行驗證。
2. 可視化探索
盡管新工具的出現讓高管也能參與到可視化探索中來,但探索性、數據型的可視化往往仍是屬于數據科學家和商業情報分析人員的領域。嘗試這個類型的可視化會令人感到興奮,因為它總能夠帶來無法以任何其他方式獲得的洞見。
由于不知道要找的結論是什么,我們往往會將所有數據都放進圖表中。在某些極端案例中,此類可視化任務可能會同時納入多個數據集,甚至可能包含實時更新的動態數據。它甚至冒險超越數據本身。
政治學家和統計分析師大衛·斯帕克斯(David Sparks),現為NBA波士頓凱爾特人隊從事可視化探索工作,但他將自己的工作定義為“模型可視化”。斯帕克斯認為,數據可視化的對象是真實既有的統計數據;模型可視化則是利用歷史統計數據創建模型后,帶入新數據,從而預測在特定條件下可能發生什么。
探索有助于交互性——允許管理者即時調整參數,注入新數據或者隨時對可視化圖表做出調整。復雜數據有時也更宜使用特殊的或不常見的可視化類型,例如展示集群關系網的力導向網絡圖(force-directed network diagram),或者地形圖。
在可視化探索中,功能才是決定采用圖表與否的最重要因素:軟件操作能力、編程能力、數據管理能力和運用商業智能的能力,都比提高圖表展示性的能力更為關鍵。在這一象限中,管理者最有可能需要依賴專家的配合。
一家社交媒體公司的經理正在為自己的技術尋找新的市場。他想找到別人還不曾發現的市場機會。他聯系了一位數據科學家,這位科學家給他講了如何根據多個行業文字情報的相似性,使用語義分析來構建數千家企業之間聯系的映射圖。
這位經理非常喜歡這個想法,但他自己無法完成。于是他聘請了這位數據科學家,他們一起創建并調整數據集,最終得到了一個映射了數千家企業的草圖。語義分析將相似的公司聯系起來,相似性越大,聯系就越強,兩者在圖中的位置也越近。
他們最終做出了這個網狀圖,該圖將產業集群情況十分清晰地呈現了出來。相鄰集群之間的空白說明連接兩個行業的市場機會仍然存在——盡管數據顯示兩個集群相似性很高,但仍未有填補這個市場空白的企業出現。
這位經理立即注意到,社交媒體和游戲產業之間沒有太多的空白空間,這個發現也并不令人驚訝,他自己就玩過糖果傳奇(Candy Crush Saga)。但他確實看到了社交媒體與教育和生物燃料等其他產業之間的空白,對他的技術而言,這些都是潛在的新市場。
04 日常數據可視化
數據科學家的工作以探索性為主,而管理者主要使用的是日常數據可視化這類圖表。這類圖表就是我們通常用Excel做好,再粘貼到PPT中的各類基礎圖表,通常形式比較簡單,如折線圖、條形圖、餅圖和散點圖等。
這里的關鍵詞就是“簡單”。數據集往往小而簡單;圖表傳遞一條簡單的觀點或信息,變量數也較少;圖表目的也很簡單:提供基于數據的、不會引起爭議的事實信息。
簡潔是此類圖表設計的最大挑戰。清晰、完整的特點讓這類圖表在正式演示情境中非常有效。在正式演示中,設計不當的圖表讓演講者不得不將有限的時間浪費在解釋圖表結構和本該其義自見的信息上。因此,一位管理者應該有能力做出不言自明的日常數據可視化圖表。如果圖表不能一目了然,它就像一個需要解釋的笑話一樣失敗了。
這并不是說陳述性圖表不應該引發討論。相反,它們應該。但討論應該針對圖表的觀點,而不是圖表本身。
一名人力資源副總裁將向執行委員會其他成員介紹公司的醫療保健費用使用情況。她想傳達的一個關鍵信息是,這些支出的增速明顯放緩了,而公司可以借此機會考慮為員工提供一些額外的服務。
她在網上讀到了一份關于醫療保健支出增速放緩的報告,報告中提供了一些政府數據的鏈接。因此,她下載了數據,點擊了Excel的折線圖選項,幾秒鐘之內就做出了一個圖表。但由于這幅圖是作正式匯報之用,她請一位設計師同事幫忙添加了更多描述GDP和經濟衰退的數據細節,為數據提供了一個更全面的背景。
此圖設計良好,繪制精確,但不一定合適。執行委員會不需要通過了解20年來的宏觀經濟數據,來決定公司員工福利的投資策略。她想表達的是,過去幾年中,員工醫療保健費用增速有所放緩。那么,這個信息是否明顯?
一般來說,如果圖表包含的數據量需要花幾分鐘而不是幾秒鐘才能消化,那么這樣的圖表更適合在紙面或個人屏幕上閱讀,適用于不需要一邊聽演講,一邊吸收圖表信息的情境。例如,醫療保健政策制定者如果在政策聽證會之前看到這幅圖,可能會從中受益,他們將因此在聽證會上就政策的長期趨勢展開討論。
但我們這位高管需要為自己的演講內容找到一個更簡潔的圖表形式。用同一個數據集,她做出了如下頁所示的“年增長率下降”圖。
▲資料來源:CENTERS FOR MEDICARE & MEDICAID SERVICES
無須她費口舌,公司高管們就理解了這個趨勢。她用圖表清楚而準確地為自己的提案奠定了討論的基調。
關于作者:斯科特·貝里納托(Scott Berinato),《哈佛商業評論》雜志高級編輯、數據分析師和可視化專家,同時也是一位獲獎作家和內容架構師。他自稱為“可視化極客”,喜歡利用可視化的方法解決各類溝通問題。他倡導《哈佛商業評論》雜志使用視覺傳達和講故事的方法,并親自創作了一些頗受歡迎的圖表形式。
本文摘編自《好圖表,壞圖表:可視化語言打造看得見的說服力》,經出版方授權發布。
延伸閱讀《好圖表,壞圖表》
點擊上圖了解及購買
轉載請聯系微信:DoctorData
推薦語:職場必備溝通技能!《哈佛商業評論》可視化思維經典入門指南。4個步驟、300余張好圖表VS壞圖表,讓你熟練掌握可視化語言,提升說服力和影響力,實現職場跨越式成長。
刷刷視頻👇
干貨直達👇
學習全球最火編程語言Python,要讀哪些書?
終于有人把DevOps講明白了
特斯拉大戰愛迪生
什么是區塊鏈?真能改變貨幣和商業?終于有人講明白了
更多精彩👇
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
大數據?|?云計算?|?數據庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?數學?|?算法?|?數字孿生
據統計,99%的大咖都關注了這個公眾號
👇
總結
以上是生活随笔為你收集整理的详解数据可视化的4种类型:手把手教你正确选择图表的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 自动驾驶:梦想已经照进现实?
- 下一篇: 刚刚!第七次人口普查出炉!男性比女性多3