你好,我是可樂
今天,當(dāng)我們游刃有余地使用圖表來進行數(shù)據(jù)可視化操作的過程中,不知道你有沒有想過一個問題:
這些圖表都是怎么來的?
一開始,人們并沒有意識到可以用圖形來描述枯燥的文字,通過圖形來表示數(shù)量,還是一個相對較新的發(fā)展領(lǐng)域。
前人栽樹,后人乘涼,這篇文章就帶你了解那些圖形/圖表的發(fā)展歷史。
1786年,William Playfair繪制了英格蘭在1700年到1780年的進出口數(shù)據(jù)的線圖,被認(rèn)為是歷史上最早的線圖,也就是折線圖,橫軸是時間刻度,年份,縱軸是數(shù)值。
(插一個題外話,1786年對應(yīng)我國清朝乾隆時期,我們總說數(shù)據(jù)分析要具備對比的思維,對比來了)
折線圖是由直角坐標(biāo)系、點和線組成的圖表。通常用來展示數(shù)值型數(shù)據(jù)隨時間的變化,相比條形圖,它更能體現(xiàn)數(shù)據(jù)趨勢。
使用需注意:縱坐標(biāo)軸一般從0開始
選用相對較粗的線型
盡量不要超過5條線。
若為預(yù)測值,請用虛線表示
還是這一年,William Playfair在《商業(yè)與政治圖解》中創(chuàng)造性地使用條形圖來呈現(xiàn)離散數(shù)量的比較,描述了蘇格蘭在1780年~1781年的進出口數(shù)據(jù),從下面這張他的原稿中我們可以看到,橫坐標(biāo)表示進出口的具體數(shù)值,縱坐標(biāo)表示不同的國家,這已經(jīng)和我們今天所使用的條形圖沒什么區(qū)別了。
條形圖可用來表示比例,對相對大小進行比較,更精確,更容易發(fā)現(xiàn)細(xì)微的差別,條形圖可以垂直也可以水平,水平條形圖用于展現(xiàn)類別數(shù)據(jù),垂直條形圖用于展現(xiàn)數(shù)值型數(shù)據(jù)。
使用時需注意:
· 同一系列數(shù)據(jù)使用相同的顏色
· 盡量不要用傾斜的標(biāo)簽
· 若添加了數(shù)據(jù)標(biāo)簽,就刪掉網(wǎng)格線吧
· 讓數(shù)據(jù)由大到小排列。Playfair堅信一圖勝千言,他又發(fā)明了餅圖、折線圖等,他一生從事過很多職業(yè),商人、統(tǒng)計學(xué)家、郵遞員、翻譯、會計等,可以說是一個妥妥的斜杠青年,或許正是這些職業(yè)經(jīng)歷,帶給了他圖形創(chuàng)作的靈感。
發(fā)明條形圖后的15年,也就是1801年,Playfair在他的《統(tǒng)計學(xué)摘要》中,他用餅圖描述了當(dāng)時的土耳其帝國在亞洲、歐洲和非洲的領(lǐng)土面積的比例,從他的原稿中可以看出,歐洲占比25%(右上直角),亞洲占比60%,非洲占比15%。這是餅圖的首次亮相。
(1801年,此時中國進入清朝嘉慶帝時代)
餅圖,是將數(shù)據(jù)劃分為幾個有明顯區(qū)別的扇形的圓形統(tǒng)計圖表。在餅圖中,每個扇形的弧長(以及圓心角和面積)大小,表示該種類占總體的比例,且這些扇形合在一起剛好是一個完全的圓形。
餅圖主要體現(xiàn)的是比例,但是,由于人類對角度的感知力并不如長度,當(dāng)所有扇區(qū)大小相近時,使用餅圖就無太大意義,建議用柱狀圖或條形圖代替。如下圖所示,用餅圖分不清細(xì)微差別,但是用柱狀圖則一目了然。
使用時需注意:使用時,須確認(rèn)各個扇形的數(shù)據(jù)加起來等于100%;
避免扇區(qū)超過5個,盡量讓圖表簡潔明了;
注意扇形的排布順序,一般情況下,將最大的扇形放在12點鐘方向,接下來按面積依次排列;
最后,正確使用顏色,既區(qū)分出需要強調(diào)的扇形,又不致于讓人眼花繚亂。
1833年,John Herscherl 發(fā)表了一篇觀察雙星軌道的文章,其中使用了散點圖展現(xiàn)觀測時間和位置角之間的關(guān)系,這是第一個具有現(xiàn)代意義的散點圖。John Herscherl是發(fā)現(xiàn)了天王星和紅外光的威廉·赫歇爾的兒子。
(1833年,清朝道光時期,第一次鴉片戰(zhàn)爭即將爆發(fā))
前面我們說的圖表都是一維的,而散點圖是一個典型的二維圖表,它是由兩組數(shù)據(jù)構(gòu)成的多個坐標(biāo)點的統(tǒng)計圖表,主要用于數(shù)據(jù)趨勢的展示和數(shù)據(jù)間相關(guān)性的說明。
使用時需注意:散點圖適用于變量之間關(guān)系的探索
在用散點圖做相關(guān)性分析時,數(shù)據(jù)量若太少則沒有太大的說明意義
數(shù)據(jù)點過大、過多,也會影響數(shù)據(jù)圖的可讀性
數(shù)據(jù)分類不宜過多,分類太多會失去對比的意義
南丁格爾玫瑰圖,是餅圖的變種,它是弗羅倫斯·南丁格爾女士發(fā)明的,又名為極區(qū)圖、雞冠花圖。
要說到南丁格爾女士,也是很傳奇,她首先是一位護士,其次也是一名統(tǒng)計學(xué)家,更是英國皇家統(tǒng)計學(xué)會的第一位女性會員。
19世紀(jì)50年代,英國、法國、土耳其和俄國進行了克里米亞戰(zhàn)爭。南丁格爾主動申請,自愿擔(dān)任戰(zhàn)地護士。當(dāng)時的醫(yī)院衛(wèi)生條件極差,甚至連干凈的水源與廁所都沒有,傷士死亡率高達42%,直到 1855 年衛(wèi)生委員會來到醫(yī)院改善整體的衛(wèi)生環(huán)境后,死亡率才戲劇性地降至 2.5% 。當(dāng)時的南丁格爾注意到這件事,認(rèn)為政府應(yīng)該改善戰(zhàn)地醫(yī)院的條件來拯救更多年輕的生命。
出于對資料統(tǒng)計的結(jié)果會不受人重視的憂慮,她發(fā)明出一種色彩繽紛的圖表形式,讓數(shù)據(jù)能夠更加讓人印象深刻。
這張圖就是南丁格爾當(dāng)時報告這件事時所用的圖表,以表達軍醫(yī)院季節(jié)性的死亡率,從整體上來看:這張圖是用來說明、比較戰(zhàn)地醫(yī)院傷患因各種原因死亡的人數(shù),每塊扇形代表著各個月份中的死亡人數(shù),面積越大代表死亡人數(shù)越多。
(19世紀(jì)50年代,對應(yīng)清朝咸豐時代,此時第一次鴉片戰(zhàn)爭已經(jīng)爆發(fā),中國已經(jīng)淪為半殖民地半封建社會,1856年第二次鴉片戰(zhàn)爭爆發(fā))
這張圖里有一大一小兩個玫瑰圖,右側(cè)較大的玫瑰圖,展現(xiàn)的是1854 年 4 月至 1855 年 3 月的數(shù)據(jù);而左側(cè)的玫瑰圖,展現(xiàn)的則是 1855 年 4 月至 1856 年 3 月的數(shù)據(jù),以1855 年4 月做為分界,將24 個月的資料切分為左右兩張圖再用黑色線條連結(jié),是因為這大約便是衛(wèi)生委員會來改善環(huán)境時的日期,也因此我們可以比較兩個年度的死亡人數(shù)與其原因的概略比例。
· 灰色的區(qū)域的面積明顯大于其他顏色的面積。這意味著大多數(shù)的傷亡并非直接來自戰(zhàn)爭,而是來自糟糕醫(yī)療環(huán)境下的感染。
· 衛(wèi)生委員到達后(1855年3月),死亡人數(shù)明顯的下降。
她的方法打動了當(dāng)時的高層,包括軍方人士和維多利亞女王本人,于是醫(yī)事改良的提案才得到支持,因該圖的外形酷似一朵綻放的玫瑰,因此“南丁格爾玫瑰圖”也就由此而來。
關(guān)于該圖形的制作方法,我在 教你做超驚艷的南丁格爾玫瑰圖 這篇文章中有詳細(xì)的說明。
使用時需注意:
餅圖是用角度的大小體現(xiàn)數(shù)值或占比;
南丁格爾玫瑰圖是用扇形的半徑表示數(shù)據(jù)的大小,各扇形的角度則保持一致。
可以說南丁格爾玫瑰圖實際上是一種極坐標(biāo)化的圓形直方圖。它夸大了數(shù)據(jù)之間差異的視覺效果,適合展示數(shù)據(jù)原本差異小的數(shù)據(jù)
霍亂,是因攝入的食物或水受到霍亂弧菌污染而引起的一種急性腹瀉性傳染病,能在數(shù)小時內(nèi)造成腹瀉脫水甚至死亡。
1854年倫敦蘇荷區(qū)爆發(fā)霍亂,當(dāng)時人們還不知道霍亂是為何引起的,更不知該如何應(yīng)對。面對這種傳染率強,致死率也高的傳染病,當(dāng)時的人們束手無策。
英國麻醉學(xué)家、流行病學(xué)家John Snow走訪疫區(qū),在地圖上用散點來表示霍亂案例與周圍水泵的關(guān)聯(lián),并且用統(tǒng)計數(shù)據(jù)來說明水源水質(zhì)與霍亂的相關(guān)性,最終鎖定了一個公共水井。
(1856年第二次鴉片戰(zhàn)爭爆發(fā),清政府被迫簽訂了一系列不平等條約)
雖然約翰·斯諾并沒有發(fā)現(xiàn)霍亂病的病原體,但創(chuàng)造性地使用空間統(tǒng)計學(xué)查找到傳染源,給了后人無限的利用價值。有點類似我們現(xiàn)在數(shù)據(jù)地圖的前身。隨著公共衛(wèi)生體系的成熟,配合抗生素治療,霍亂已經(jīng)沒有那么可怕了。
1812年拿破侖向俄國宣戰(zhàn),從法國出發(fā)進軍莫斯科,最后失敗。
法國土木工程師Charles Joseph Minard于1869年11月20日發(fā)表了一幅統(tǒng)計圖形,將桑基圖與制圖以及溫度線圖表結(jié)合在一起,對這場戰(zhàn)爭的進程進行了非常直觀的展示。42.2萬人的軍隊是如何在戰(zhàn)斗、地理和冰凍的影響下付出慘痛代價,最終減少到只有1萬人的,這就是著名的拿破侖東征圖,也是最早的?;鶊D。
這幅圖展示了拿破侖軍隊的數(shù)量、行進的路程、維度、經(jīng)緯度、行進方向、特定日期或事件的位置。
(1869年,清朝同治時期,慈禧掌權(quán))
桑基圖,是一種表現(xiàn)流程的示意圖,用于描述一組值到另一組值的流向。分支的寬度對應(yīng)了數(shù)據(jù)流量的大小。如下圖所示,對用戶轉(zhuǎn)化情況進行了描述,多少用戶加入購物車,又有多少用戶付款等流程。
使用時需注意:參考:
1.http://www.tuzhidian.com/chart?id=5c553ca258461d3fa6136677
2.https://blog.csdn.net/weixin_38754337/article/details/113532959
3.《統(tǒng)計之美》
4.http://finance.sina.com.cn/money/fund/fundzmt/2020-01-21/doc-iihnzahk5562348.shtml
5.https://www.datavis.ca/papers/friendly-scat.pdf