中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項超值服

開通VIP
菜鳥數(shù)據(jù)分析師對數(shù)據(jù)可視化的理解

本人新人一枚,是個菜鳥數(shù)據(jù)分析師,統(tǒng)計學(xué)專業(yè),接觸數(shù)據(jù)分析大概有半年,在這里稍微寫一下自己對可視化的拙見,大牛們看了不對地方還望指正;剛剛工作不久就談對可視化的理解確實是有些過了,個人因為也看不了不少可視化的手冊或者書,例如:數(shù)據(jù)可視化之美,R語言可視化手冊,數(shù)據(jù)可視化設(shè)計指南等,因為工作本來沒什么機(jī)會寫博客總結(jié),借著天善這個社區(qū)寫寫總結(jié),讓自己進(jìn)步,廢話不多說;

什么是數(shù)據(jù)可視化?在我看來,數(shù)據(jù)可視化就是用圖表的形式展示數(shù)據(jù)的信息;讓展示的東西有視覺沖突,讓人能出圖表中一目了然看出你想要表達(dá)的信息;這里很關(guān)鍵一點就是,你想要展示數(shù)據(jù)的什么信息,很多人為了盲目的追求可視化的一些酷炫效果,得到的東西卻不知道表達(dá)的是什么,那么這個可視化是失敗的;當(dāng)然可視化也要簡潔,簡單明了才是可視化的目標(biāo)所在,畢竟做數(shù)據(jù)可視化是幫助人們?nèi)ダ斫鈹?shù)據(jù),認(rèn)識數(shù)據(jù),從多個側(cè)面去觀察數(shù)據(jù),并告知告知別人你想表達(dá)的數(shù)據(jù)中的信息;

這工作半年下來,我用了不少可視化的一些軟件或者編程語言,一開始我最早接觸的是大家基本都能聽過的EXCEL,功能特別強(qiáng)大,用它都可以做數(shù)據(jù)分析,然而原諒我沒有把它學(xué)好,EXCEL它其實可以做很多的事情,簡單方便的生成各種你需要的圖表,雖然顏色上不是那么讓人喜歡,要是有耐心可以慢慢的調(diào),加一下后期制作或者渲染;然后就是TABLEAU,這個軟件確實是強(qiáng)大,能夠連接多種數(shù)據(jù),拖拽式的操作,可以自動的幫你生成圖表,界面簡潔易操作,要全放開版的收費(fèi),作為剛剛工作的小白只能用它的免費(fèi)版的,不過限制挺多的;接下來就是R語言了,這是一個開源的統(tǒng)計語言,在數(shù)據(jù)分析方面和可視化方面都無比強(qiáng)大,第一次用上了GGPLOT2這個包我便開始喜歡上了這個編程語言,這個包的構(gòu)圖思想是圖層思想,一個圖層一個圖層去操作,特別的靈活,我正在學(xué)習(xí)R語言,希望在今年能稍微精通一下;下面說一下自己對各種圖形或者可視化的理解

柱狀圖

柱狀圖確實是一個很強(qiáng)大的圖形,為什么說它強(qiáng)大呢?因為個人看,柱狀圖在展示的數(shù)據(jù)類型上可以選擇非連續(xù)的數(shù)據(jù)數(shù)據(jù)類型和連續(xù)的數(shù)據(jù)類型,又有常用的柱狀圖和側(cè)面柱狀圖,還可以用來折疊去展示數(shù)據(jù);當(dāng)我們的去展示非連續(xù)的數(shù)據(jù)類型的時候我們大部分都是用柱狀圖去展示這類的數(shù)據(jù)分布,大概能看出這個數(shù)據(jù)分布情況,又可以用來比較不同數(shù)據(jù)的整體與部分的關(guān)系;在展示連續(xù)的數(shù)據(jù)類型的大部分是用來展示這類數(shù)據(jù)的時間趨勢。或者數(shù)據(jù)的分布。在設(shè)計上我個人認(rèn)為柱狀在設(shè)計的時候底層的便簽最好不要太長和斜著或者90度垂直于坐標(biāo)軸,因為這樣為方便別人去閱讀你的圖表,畢竟可視化是方便別人去解讀你的數(shù)據(jù),能簡單易懂就是最好不過了,在各個的柱形下的柱子的間距多少為妙呢?其實個人人為不宜過寬也不宜近,長度大概在柱狀的寬度的一半左右為佳,在顏色上的設(shè)計,我比較偏向于柱形圖用一種顏色,如果要想展示數(shù)據(jù)突出的部分,我們只需要將顏色加深,這也是為了閱讀的簡潔性,如果一張柱形圖的顏色五花八門,那么所表達(dá)的效果是特別糟糕的。對于數(shù)據(jù)的排序,如果沒有某種特殊的要求,我們最好給數(shù)據(jù)排下序,當(dāng)然,如果展示的時間趨勢的話就沒法排序了。

餅圖

餅圖大部分得的時候是展示部分和總體的關(guān)系,不過餅圖有個缺點就是,當(dāng)部分特別繁多的時候就不能用來展示了,因為界面效果會特別差;常用的兩種方式是餅狀和環(huán)狀兩種。餅狀的直接展示各個部分于總體的關(guān)系,而環(huán)狀的保留餅狀的樣式,中間部分可以展示突出的數(shù)據(jù)。餅圖在一般的展示情況大多數(shù)人為了展示一個百分比這個數(shù)不管有多少個部分都是去用餅圖,然而餅圖一般用情況下部分五六個為佳,當(dāng)多個部分的時候,很多數(shù)據(jù)沒法展示出來,也就是掩蓋了部分的信息,有時候我們需要對比兩個總體的結(jié)構(gòu),大部分人都會選擇去用兩個餅圖去比較,然后這個效果不太好,所以一般要比較結(jié)構(gòu)的差異的話最好不要使用多個餅圖去展示,最好使用堆疊柱狀圖去比較兩個總體的差異,還有展示的時候部分最好經(jīng)過大到小的排序。

折線圖

折現(xiàn)圖大部分情況下都是去展示連續(xù)的數(shù)據(jù)類型,常用是時間趨勢,它可以很好的展示趨勢,累積,減少以及變化;在設(shè)計上,縱坐標(biāo)最好是能從0開始,因為這樣避免有些地方讓人誤讀,展示線條上我們最好能夠選擇實心的線條,不要用虛線或者點去表示線,這樣情況下看著看著容易分析,一張折現(xiàn)圖的線三四條為佳,過多的線只會讓觀察某條線的時候看錯了,如果要展示多條,可以在下一張圖上去展示,如果你要展示的數(shù)據(jù)是多個部分的話,這些部分的數(shù)據(jù)最好能有一個共同趨勢,不然有升又降趨勢讓人看不知所措。還有一個細(xì)節(jié)的地方,就是加圖例的時候最好折線末尾那時候加,對應(yīng)的折線加對應(yīng)的圖例,方便人讀懂你的折線。

散點圖

散點圖做研究的時候用的比較多,因為散點圖大部分情況是用來探究兩個部分的關(guān)系的時候用的,就先做相關(guān)分析的時候要用散點圖觀察一下是否有相關(guān)關(guān)系;設(shè)計上改注意的和上面的圖一樣,縱坐標(biāo)最好能從0開始,當(dāng)想要展示多種關(guān)系的話的,我們可以利用點的大小和顏色去探究,在有某種趨勢關(guān)系下我們最好加個輔助的線,方便別人看出相關(guān)性;

氣泡圖

氣泡圖有點類似于加了大小的散點圖,氣泡圖還可以在展示地域數(shù)據(jù)的可視化,在設(shè)計上我們需要注意的是,氣泡的尺寸我們需要去注意,例如我們在展示數(shù)據(jù)的大小比例最好面積的比例一樣,不要用半徑,如果用半徑的話就是1:4了,大小差異就過大了,氣泡的形狀上最好使用老老實實的圓最好,不要用一些奇怪的圖像。

熱點地圖

怎么說呢,我覺得熱點地圖的展示是很考驗人的技能,第一個熱點地圖要展示的數(shù)據(jù)與地域關(guān)系差異較大類型的數(shù)據(jù)才能體現(xiàn)出它的價值,也就是說有背景故事或者價值去讓我們發(fā)現(xiàn)的數(shù)據(jù),熱點地圖主要是通過強(qiáng)烈的色彩對比去體現(xiàn)數(shù)據(jù)的差異,有個缺點就是沒法很具體的表達(dá)數(shù)據(jù)之間差距而不是差異。在設(shè)計上,我推薦色彩最好是一種色調(diào),通過顏色的深淺去反映數(shù)據(jù)的強(qiáng)度,如果色彩過于繁多,對于讀者來說讀這張圖是個負(fù)擔(dān),也無法體現(xiàn)出數(shù)據(jù)之間的差異,輪廓最好簡單即可,畢竟簡約美嘛,上色的時候會有一個叫色階的東西,這時候什么數(shù)據(jù)范圍位于哪個色階最好分清楚,最好能體現(xiàn)出差異,不要全部都是一個色階,不然熱點地圖就是去了它的意義了。

上面說的是對于圖表的理解,下面說下對常用的展示方式的一些理解;

尺寸:就是用柱形的長短,餅圖的大小這類去展示,這可能是我們大家最為常用的一種方式去展示數(shù)據(jù),當(dāng)展示兩個對象的數(shù)據(jù)的時候,我們可以通過尺寸馬上的發(fā)現(xiàn)了兩個對象之間的差異,在展示的精準(zhǔn)讀上也有些不同,個人人為點的精度大于線條大于面的精度。

色彩:色彩是用來展示大數(shù)據(jù)的非常好的方式,因為大數(shù)據(jù)之間會有不少的差異,顏色恰恰是展示這些差異最好的方式,畢竟我們?nèi)颂焐鷮ι蠲鞲?,在色階的選取上我覺得最好能夠有明顯的差異。

位置:差不多就是我們所說的地圖了,這是基于位置的可視化方式,一般我們都用于展示于位置較強(qiáng)關(guān)系的數(shù)據(jù)類型

網(wǎng)絡(luò):這個展示數(shù)據(jù)點之間的關(guān)系,例如就像社交網(wǎng)絡(luò),就是用這樣的展示去表達(dá)人與人之間的相關(guān)關(guān)系。

時間:展示趨勢用的最多,主要是想了解對象的發(fā)展和變化規(guī)律,讓我們了解對象整個發(fā)展脈絡(luò)。

那么成功的可視化是怎么樣子的呢?

借用《數(shù)據(jù)可視化之美》的話來說,成功的可視化總共有四點,第一點是新穎,大家都知道,數(shù)據(jù)可視化就是了簡單明了的了解數(shù)據(jù),不過你用一個全新的角度去詮釋你的數(shù)據(jù),讓讀者讀懂了你的信息又能從更高的角度去解讀這些信息;第二點信息要充實,充實不代表越多越好,因為一個圖表展示的信息過多,會讓讀者成為一種累贅,很難讀懂你的想法,充實的信息就表明你的圖表能夠能到他們想要的信息又不造成信息過多的情況,所以我們就要考慮業(yè)務(wù)應(yīng)用場景了,什么樣的場景需要用那些信息結(jié)合那些是多余的需要去判斷,第三點高效,也就是我們所說的簡單明了,一眼就能知道數(shù)據(jù)中的信息,所以我們在可視化過程中一定要把一些也主題不相關(guān)的因素排除掉,過多不相關(guān)的因素存在只會增加讀者的閱讀時間和難度;第四點美感,圖片的布局,色彩,形狀等一系列的組成部分都是相當(dāng)和諧的。

那么我們?nèi)绾卧O(shè)計成功的可視化圖表呢?

首先學(xué)習(xí)這個步驟肯定是少不了的,怎么去學(xué)習(xí),當(dāng)然是去學(xué)習(xí)一些經(jīng)典的可視化圖片,學(xué)習(xí)它是如何去構(gòu)造這張圖的,色彩為何要這樣的去運(yùn)用等,還要學(xué)習(xí)一些可視化的語言或者軟件,例如像R語言,它的有強(qiáng)大的包,ggplot2,newwordk,ggmaps(地圖)等之類強(qiáng)大的包可以去學(xué)習(xí),不然你會設(shè)計也不會操作那也是空有一身力氣,然后理解數(shù)據(jù)意義和你想要表達(dá)的信息,然后遵從圖表的一些設(shè)計規(guī)范,在規(guī)范的基礎(chǔ)在進(jìn)行一些自己的想法。

參考文獻(xiàn):

《數(shù)據(jù)可視化之美》

《數(shù)據(jù)可視化設(shè)計指南:圖表設(shè)計》


本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
學(xué)會這5個高級可視化圖表 技巧,在領(lǐng)導(dǎo)面前脫穎而出不費(fèi)力
活用這23種圖表,讓你的數(shù)據(jù)分析勝人一籌 | 推薦收藏
5個python數(shù)據(jù)可視化工具,趕快收藏起來!
什么是數(shù)據(jù)可視化?
EXCEL數(shù)據(jù)分析中常用的10個圖表
Python繪制六種可視化圖表詳解,三維圖最炫酷!你覺得呢?
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服