互聯(lián)網(wǎng)與不斷出現(xiàn)的便捷工具,讓所有人都可以無(wú)須具備數(shù)據(jù)或相關(guān)專長(zhǎng),就可以簡(jiǎn)單、低成本地將數(shù)據(jù)做成直觀的可視化圖、表。
這當(dāng)然是積極的變化,但也助長(zhǎng)了一種本能傾向,即讓數(shù)據(jù)可視化成為了一種匯報(bào)時(shí)的必備“流程”,開始無(wú)目的地進(jìn)行可視化,結(jié)果做出的圖表差強(qiáng)人意,比如機(jī)械地把電子表格單元轉(zhuǎn)換為圖表,只能提供支離破碎的信息,或者無(wú)效卻擾亂視聽影響決策的信息,進(jìn)而無(wú)法傳達(dá)出完整的理念。
正如演講和溝通專家南希·杜瓦特(Nancy Duarte)所說:“不要讓聽眾感覺你在展示一張圖表,而要回顧人的行為,描述曲線變化背后的事件。不是“來(lái)看我們的三季度財(cái)報(bào)”,而是“來(lái)看我們?yōu)槭裁礇]完成目標(biāo)”?!苯裉煳覀兙蛠?lái)說說如何在呈現(xiàn)可視化數(shù)據(jù)的時(shí)候匹配正確的圖表。
一、數(shù)據(jù)分析目的有兩種:陳述與探索
人類大腦對(duì)視覺信息的處理優(yōu)于對(duì)文本的處理,因此,用眼睛看的數(shù)據(jù)是更清晰有效地傳達(dá)與溝通信息的一種方式,核心是有效地傳遞信息。那么使用圖表、圖形和設(shè)計(jì)元素把數(shù)據(jù)進(jìn)行可視化,可以幫你更容易的解釋數(shù)據(jù)模式、趨勢(shì)、統(tǒng)計(jì)規(guī)律和數(shù)據(jù)相關(guān)性,而這些“信息背后的信息”在其他呈現(xiàn)方式下可能難以被發(fā)現(xiàn)。
依據(jù)需要傳達(dá)的性質(zhì)和目的,我們將數(shù)據(jù)可視化劃分為陳述型和探索型。前者一般是在正式場(chǎng)合向他人傳達(dá)信息,比如你想利用手中的大量數(shù)據(jù),報(bào)告每季度銷售情況;后者是當(dāng)我們想知道為什么最近銷售表現(xiàn)不佳,于是,探索是因?yàn)榧竟?jié)性波動(dòng)或者是促銷力度不夠?(本圖表使用Data Analytics數(shù)據(jù)可視化軟件制作,原數(shù)據(jù)已做脫敏處理,下同)
實(shí)際上,以探索為目標(biāo)的可視化又可分為兩種,第一種是上文例子中提到的利用數(shù)據(jù),用圖表來(lái)證實(shí)或否定你的假設(shè);第二種是如果對(duì)銷售業(yè)績(jī)下滑的原因毫無(wú)頭緒,提不出任何假設(shè)呢?就要仔細(xì)分析數(shù)據(jù),尋找其中的規(guī)律、趨勢(shì)和異常。
例如,對(duì)比銷售業(yè)績(jī)和銷售員負(fù)責(zé)區(qū)域面積,有何不同?不同地區(qū)的季節(jié)性波動(dòng)有何異同?天氣對(duì)銷售造成哪些影響?這種開放性探索能帶來(lái)新發(fā)現(xiàn)。開放性數(shù)據(jù)可視化探索,將有助于解答宏觀的戰(zhàn)略問題,如收入為何下降、效率如何提升、客戶與公司應(yīng)如何互動(dòng)等。
二、探索型數(shù)據(jù)可視化
探索型數(shù)據(jù)可視化分為兩類:一是假設(shè)檢驗(yàn),一是從數(shù)據(jù)中尋找規(guī)律、趨勢(shì)和異常。前者的目標(biāo)很明確,后者則相對(duì)發(fā)散。數(shù)據(jù)體量越大、復(fù)雜度越高、未知因素越多,探索工作的開放性就越高。
1.假設(shè)檢驗(yàn)
在這類數(shù)據(jù)可視化探索中,你要回答下面兩個(gè)問題中的一個(gè):我設(shè)想的情況是否屬實(shí)?如何用不同方式傳達(dá)這一信息?
在進(jìn)行求證時(shí),數(shù)據(jù)范圍相對(duì)可控,所使用圖表類型較為常規(guī);當(dāng)然,若想以新穎方式呈現(xiàn)信息,也可嘗試較少見的圖表。求證型圖表一般不用于正式場(chǎng)合;你要先自己找到正式展示所需的圖表。因此,你的時(shí)間不應(yīng)花在設(shè)計(jì)上,而應(yīng)快速嘗試不同模板,找到最好的數(shù)據(jù)視覺化方案。
2.開放性探索
更多時(shí)候,針對(duì)數(shù)據(jù)的開放性探索是數(shù)據(jù)科學(xué)家和商業(yè)智能分析師的領(lǐng)地,不過新出現(xiàn)的工具例如 DataHunter 旗下的 Data Analytics 軟件讓所有人都可以參與進(jìn)來(lái)。由于缺少明確目標(biāo),開放探索型圖表包含的數(shù)據(jù)范圍較廣,個(gè)別情況下可能會(huì)容納多組數(shù)據(jù),或建立自動(dòng)更新數(shù)據(jù)的動(dòng)態(tài)系統(tǒng),也可用于統(tǒng)計(jì)建模。開放性探索很值得嘗試,因?yàn)樗?jīng)常帶來(lái)獨(dú)一無(wú)二的洞見。
三、陳述型數(shù)據(jù)可視化
我們?nèi)粘9ぷ髦薪佑|最多的是陳述型數(shù)據(jù)可視化,主要涉及常用圖表,一般可在展示中直接使用。這些簡(jiǎn)單圖表包括線狀圖、柱狀圖、餅狀圖和散點(diǎn)圖等。這里的可視化需要做到“簡(jiǎn)潔”。一幅圖表應(yīng)該用有限幾個(gè)變量,清晰傳達(dá)一個(gè)信息。比如目標(biāo)很明確,為聽眾確認(rèn)并介紹背景信息。
此類圖表常用于正式展示,對(duì)清晰度和邏輯性要求也很高。正式展示通常時(shí)間有限,如果圖表設(shè)計(jì)不理想,介紹人就必須停下來(lái)解釋,而圖表中的信息本應(yīng)一目了然。這并不是說陳述性圖表不應(yīng)引發(fā)討論,但討論應(yīng)針對(duì)圖表傳達(dá)的理念,而非圖表本身。接下來(lái)數(shù)獵哥按照構(gòu)成分析、對(duì)比分析、分布分析、關(guān)系分析,4個(gè)方面,為大家介紹幾種常見的數(shù)據(jù)可視化圖表。
四、常見可視化圖表之一:構(gòu)成分析
1.餅圖/環(huán)形圖
餅圖經(jīng)常表示一組數(shù)據(jù)的占比,需要數(shù)值維度。如圖,各扇形面積代表各類型裝修材料銷售額的大小,整體為裝修材料總銷售額。右側(cè)環(huán)形圖為餅圖的變種,中心區(qū)域可展示數(shù)據(jù)或者文本信息。
餅圖也是有缺陷的,例如30%和35%在餅圖上憑肉眼是難以分辨出區(qū)別的。當(dāng)類別過多,也不適宜在餅圖上表達(dá)。因此在使用餅圖時(shí)我們需要順時(shí)針降序排列,同時(shí)維度取值在10個(gè)以內(nèi)。
2.玫瑰圖
玫瑰圖是餅圖的變種,用來(lái)對(duì)比不同類別的數(shù)值大小,在數(shù)值相差不大的時(shí)候使用。如圖,廣東省、江蘇省、山東省的GDP數(shù)額差別不是太大,如果只是使用常規(guī)餅圖,難以對(duì)比三者的大小,使用玫瑰圖則很顯然廣東省數(shù)值>江蘇?。旧綎|省
3.旭日?qǐng)D
旭日?qǐng)D也是餅圖的變種,表現(xiàn)整體在各個(gè)維度上的構(gòu)成,以及維度與維度之間的從屬關(guān)系。如圖,可以清楚看到整體的銷售額在三大類產(chǎn)品的分布,而每類產(chǎn)品的各品牌銷售額區(qū)別也可以直接對(duì)比,同時(shí)也可以看到每類產(chǎn)品的品牌分布。
4.儀表盤
模仿汽車儀表盤,采用絕對(duì)值與相對(duì)值結(jié)合的方式,展現(xiàn)某個(gè)指標(biāo)的完成情況,在項(xiàng)目進(jìn)度,計(jì)劃完成度較常見。只適合展現(xiàn)數(shù)據(jù)的累計(jì)情況,不適用于數(shù)據(jù)的分布特征等,同時(shí)一般超過100%后不太好表現(xiàn)。
5.矩形樹圖
當(dāng)我們想表達(dá)過多類型的數(shù)據(jù)時(shí),可以使用矩形樹圖,它展現(xiàn)同一層級(jí)的不同分類的占比情況,還可以同一個(gè)分類下子級(jí)的占比情況,每個(gè)矩形代表一個(gè)聚合類,顏色的深淺和面積的大小代表這個(gè)聚合類的大小。如圖,比如電子商務(wù)、產(chǎn)品銷售等涉及大量商品品類的分析等。
局限是不適合展現(xiàn)不同層級(jí)的數(shù)據(jù),比如組織架構(gòu)圖,每個(gè)分類不適合放在一起看占比情況。且當(dāng)以面積表示大小,當(dāng)數(shù)值相近時(shí)人眼難以辨別,當(dāng)然可通過填充數(shù)值彌補(bǔ)。
6.瀑布圖
采用絕對(duì)值與相對(duì)值結(jié)合的方式,展示各成分構(gòu)成情況,更多的用于核心指標(biāo)的分解,適合展示數(shù)據(jù)累積變化過程,局限是各類數(shù)據(jù)差別太大則難以比較。
如圖核心指標(biāo)為凈利潤(rùn),可以看到核心指標(biāo)由收入和成本計(jì)算得出,而收入方面營(yíng)業(yè)收入占據(jù)主要,支出方面營(yíng)業(yè)成本占據(jù)主要。我們可以提升營(yíng)業(yè)收入或降低營(yíng)業(yè)成本來(lái)提升公司凈利潤(rùn)。
五、常見可視化圖表之二:對(duì)比分析
1.柱狀圖/多指標(biāo)柱狀圖
柱狀圖是一種應(yīng)用得很廣泛的圖形,它表征分類型變量與數(shù)值型變量的關(guān)系,常用于多個(gè)維度的比較和變化。柱形圖至少需要一個(gè)數(shù)值型維度,通常文本維度/時(shí)間維度通常作為X軸,數(shù)值型維度作為Y軸。
一般需要排序,如果分類型變量是有序的,按照它本身的順序排列即可,如果分類型變量無(wú)序,那么則根據(jù)數(shù)值型變量的大小進(jìn)行排序,使柱狀圖的高度單調(diào)變化。如左圖,各類型裝修材料的銷售數(shù)量對(duì)比,右圖為各類型裝修材料的銷售額及銷售成本對(duì)比。
2.條形圖/多指標(biāo)條形圖
類似柱狀圖,只不過兩根軸對(duì)調(diào)了一下。因?yàn)橛写罅靠瞻孜恢脴?biāo)示每個(gè)類別的名稱,所以適用于類別名稱過長(zhǎng)的情況,但分類過多則無(wú)法展示數(shù)據(jù)特點(diǎn)。
3.象形圖
以形象化的圖片數(shù)量代表維度數(shù)值的大下,多用于具體實(shí)物的對(duì)比。如圖,其中將辦公用品、技術(shù)產(chǎn)品和家居產(chǎn)品用形象化圖形來(lái)代表其維度,讓觀眾者很容易了解到這組數(shù)據(jù)的維度表示。
4.堆積柱圖/堆積條圖
用來(lái)比較同類別各變量和不同類別變量總和差異。需要注意的是堆積柱內(nèi)各項(xiàng)間具有相同性質(zhì)的維度劃分,最好不要是不同的度量。如圖,柱與柱之間表示各區(qū)域訂單數(shù)量對(duì)比,華南訂單數(shù)量可以看到是由三個(gè)產(chǎn)品訂單數(shù)量組成??赏瑫r(shí)對(duì)比三個(gè)類別產(chǎn)品在各區(qū)域訂單數(shù)量。
5.折線圖
折線圖是用來(lái)觀察數(shù)據(jù)的趨勢(shì),主要展示數(shù)據(jù)隨時(shí)間或有序類別的波動(dòng)情況的趨勢(shì)變化。對(duì)比時(shí)使用,常見時(shí)間維度對(duì)比。如果是無(wú)序類別則無(wú)法展示數(shù)據(jù)特點(diǎn)。
6.面積圖
用面積展示數(shù)值大小,展示數(shù)量隨時(shí)間變化的趨勢(shì)。多用于時(shí)間維度的對(duì)比,其中堆積面積圖中堆積部分需要是具有相同性質(zhì)的維度劃分。
7.雷達(dá)圖
雷達(dá)圖將多個(gè)分類的數(shù)據(jù)量映射到坐標(biāo)軸上,對(duì)比某項(xiàng)目不同屬性的特點(diǎn),適用于了解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。它在商務(wù)、財(cái)務(wù)領(lǐng)域應(yīng)用較大,常見于經(jīng)營(yíng)狀況,財(cái)務(wù)健康程度。比如對(duì)企業(yè)財(cái)務(wù)進(jìn)行分析,劃分出六大類:銷售、市場(chǎng)、研發(fā)、客服、技術(shù)、管理。通過雷達(dá)圖繪制出預(yù)算和實(shí)際開銷的維度對(duì)比,會(huì)很清晰。另外在游戲中也應(yīng)用廣泛,如圖游戲人物的各項(xiàng)數(shù)值對(duì)比。
這里需要注意雷達(dá)圖的數(shù)據(jù)必須進(jìn)行標(biāo)準(zhǔn)化處理,同時(shí)指標(biāo)是正向且可以比較的,也就是指標(biāo)代表越好,且當(dāng)指標(biāo)差異較大時(shí),需要進(jìn)行標(biāo)準(zhǔn)化,消除單位影響。另外雷達(dá)圖是靜態(tài)數(shù)據(jù),不可能有時(shí)間維度,同時(shí)能表達(dá)的靜態(tài)數(shù)據(jù)信息有限,線條不宜超過5條,指標(biāo)不宜超過8個(gè)。
8.對(duì)比條圖
兩個(gè)項(xiàng)目在各個(gè)維度的對(duì)比時(shí)使用。如圖展示了廣東省、江蘇省、山東省和浙江省在2015年與2016年的GDP對(duì)比,可以看到四省對(duì)比,廣東省GDP較高,而2015年與2016年GDP對(duì)比,則2016年增長(zhǎng)明顯。
9.子彈圖
對(duì)比條形圖的變種,多用于對(duì)比實(shí)際與目標(biāo)之間的差距。如圖表現(xiàn)的是各樂行裝修材料的銷售額完成度,且均存在深度灰色以內(nèi),表現(xiàn)不理想。
10.雙軸圖
以左右兩個(gè)Y軸的形式,展示同一維度下不同指標(biāo)的情況。兩個(gè)坐標(biāo)軸的圖表類型選擇需要區(qū)分開。
11.帕累托圖
雙軸圖變種,用來(lái)分析原因,確定產(chǎn)生問題的主要原因。如圖可以看到,特殊節(jié)日和行業(yè)旺季是此次數(shù)據(jù)異常的最重要原因,兩項(xiàng)占比達(dá)到了56%,可加強(qiáng)此階段的促銷,幫助銷量增長(zhǎng)。
12.漏斗圖
漏斗圖是流程轉(zhuǎn)化分析,適用于關(guān)鍵業(yè)務(wù)環(huán)節(jié)數(shù)據(jù)比較,將各環(huán)節(jié)串聯(lián)起來(lái)構(gòu)成漏斗,量化流程內(nèi)環(huán)節(jié),追蹤各環(huán)節(jié)轉(zhuǎn)化率。轉(zhuǎn)化是漏斗圖主要表達(dá)的信息。例如在網(wǎng)站的用戶行為分析中,如圖,反映了報(bào)告瀏覽人數(shù)中,有5%的用戶下載了此報(bào)告。在實(shí)際工作中,各種業(yè)務(wù)流程均可構(gòu)建漏斗。
13.詞云
詞云主要展現(xiàn)文本信息,對(duì)出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,常用于對(duì)比文本出現(xiàn)頻次。如用戶畫像標(biāo)簽,搜索關(guān)鍵詞頻次、新聞關(guān)鍵詞頻次。如圖為各類型裝修材料的搜索次數(shù),可以看到國(guó)產(chǎn)強(qiáng)化的搜索次數(shù)較高,可加大此類關(guān)鍵詞的搜索營(yíng)銷。
六、常見可視化圖表之三:分布
1.散點(diǎn)圖/氣泡圖/四象限圖
散點(diǎn)圖在報(bào)表中不常用到,但是數(shù)據(jù)分析中比較常見。散點(diǎn)圖通過坐標(biāo)軸來(lái)揭示數(shù)據(jù)間的關(guān)系,發(fā)掘變量與變量之間的關(guān)聯(lián),當(dāng)存在大量數(shù)據(jù)點(diǎn),結(jié)果更精準(zhǔn),比如回歸分析。當(dāng)數(shù)據(jù)量小的時(shí)候會(huì)比較混亂。氣泡圖是散點(diǎn)圖的變種,它使用氣泡代替散點(diǎn)圖的數(shù)值點(diǎn),面積大小代表數(shù)值大小。
如圖使用銷售額和利潤(rùn)來(lái)定位不同類別產(chǎn)品,位于右上角的產(chǎn)品為銷售額高、利潤(rùn)也高的明星產(chǎn)品;左下角的銷售額、利潤(rùn)都不高的產(chǎn)品,為滯銷品。
2.地圖
一切和空間屬性有關(guān)的分析都可以用到地理圖。比如各地區(qū)銷量,或者某商業(yè)區(qū)域店鋪密集度等。一般用顏色深淺或氣泡大小來(lái)展示區(qū)域范圍的數(shù)值大小。比如人口密度、各地區(qū)銷量,或者某商業(yè)區(qū)域店鋪密集度等。
3.箱線圖
箱線圖(Boxplot)也稱箱須圖(Box-whisker Plot),它是用一組數(shù)據(jù)中的最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)和最大值來(lái)反映數(shù)據(jù)分布的中心位置和散布范圍,可以粗略地看出數(shù)據(jù)是否具有對(duì)稱性。通過將多組數(shù)據(jù)的箱線圖畫在同一坐標(biāo)上,則可以清晰地顯示各組數(shù)據(jù)的分布差異,為發(fā)現(xiàn)問題、改進(jìn)流程提供線索。假如你是一位互聯(lián)網(wǎng)電商分析師,你想知道某商品每天的賣出情況:該商品被用戶最多購(gòu)買了幾個(gè),大部分用戶購(gòu)買了幾個(gè),用戶最少購(gòu)買了幾個(gè)。箱線圖就能很清晰的表示出上面的幾個(gè)指標(biāo)以及變化。
另外企業(yè)產(chǎn)品質(zhì)量管理、人事測(cè)評(píng)、探索性數(shù)據(jù)分析等統(tǒng)計(jì)分析活動(dòng)也經(jīng)常會(huì)被應(yīng)用到,如圖,可以發(fā)現(xiàn),華北地區(qū)出現(xiàn)超出范圍的異常值,可通過結(jié)合業(yè)務(wù)場(chǎng)景分析異常原因。
4.熱力圖
熱力圖可以用于對(duì)比兩個(gè)維度的數(shù)值大小,用顏色深淺代表數(shù)值的大小。熱力圖在網(wǎng)頁(yè)分析、業(yè)務(wù)數(shù)據(jù)分析等其他領(lǐng)域也有較為廣泛的應(yīng)用。如圖展示了不同區(qū)域在不同時(shí)間的訂單數(shù)量。
七、常見可視化圖表之四:關(guān)系分析
1.?;鶊D
桑基圖是一種特定類型的流程圖,圖中延伸的分支寬度對(duì)應(yīng)數(shù)據(jù)流量的大小,它常表示信息的變化和流動(dòng)狀態(tài)。常用于能源、材料成分、金融等數(shù)據(jù)的可視化分析,還有網(wǎng)站用戶行為路徑的分析。如圖,可以看到用戶在登錄后的行為,以及下一步行為。
2.關(guān)系樹圖
表現(xiàn)各個(gè)維度之間的關(guān)系,多用于組織架構(gòu)分析,如圖可以表現(xiàn)不同類型產(chǎn)品的組合方式。
3.關(guān)系圖
表現(xiàn)各個(gè)維度之間的關(guān)系,及各關(guān)系間的關(guān)系強(qiáng)弱。比如社交關(guān)系鏈、品牌傳播、或者某種信息的流動(dòng)。如圖展示不同類型產(chǎn)品的銷售額貢獻(xiàn)情況,如辦公產(chǎn)品的銷售額由哪些產(chǎn)品貢獻(xiàn)。
八、小結(jié)
數(shù)據(jù)可視化是借助圖形化手段,更清晰有效地傳達(dá)與溝通信息的一種方式,在傳達(dá)信息這個(gè)目的之下,我們就要正確地進(jìn)行選擇,首先需要依據(jù)數(shù)據(jù)類型和目的選擇正確的圖表類型。
當(dāng)我們做數(shù)據(jù)可視化時(shí),可以先對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行分析,得出自己的初步結(jié)論,明確要表達(dá)的信息和主題(即,你通過圖表要說明什么問題)。然后根據(jù)這個(gè)目的在現(xiàn)有的或你知道的圖表信息庫(kù)中選擇能夠滿足你目標(biāo)的圖表類型。最后開始動(dòng)手制作圖表,并對(duì)圖表進(jìn)行美化、檢查,直至最后圖表完成。
這里需要注意,數(shù)據(jù)可視化只是表層的東西,數(shù)據(jù)分析才是核心。那如何才能更好的讓數(shù)據(jù)分析幫助我們做決策?DataHunter就能幫到你了。Data Analytics是一個(gè)輕量級(jí)業(yè)務(wù)數(shù)據(jù)可視化平臺(tái),可一鍵快速接入企業(yè)本地和云端內(nèi)外部Execl/CSV等數(shù)據(jù)文件,無(wú)需編程僅需簡(jiǎn)單的拖拽即可制作酷炫的數(shù)據(jù)可視化看板,用直觀的數(shù)據(jù)幫你做好的決策。
本文中所有圖表都是使用Data Analytics數(shù)據(jù)可視化軟件制作,原數(shù)據(jù)已做脫敏處理
-數(shù)據(jù)分析展示就用DataHunter-
聯(lián)系客服