數(shù)據(jù)可視化圖表該怎么選擇?
本文基于Andrew Abela的分類方法,介紹常用的圖表及其使用的注意事項,力求讓大家快捷準(zhǔn)確地掌握可視化設(shè)計圖表的用法。
如今,無論是公司運(yùn)營、數(shù)據(jù)分析、產(chǎn)品設(shè)計或者是進(jìn)行數(shù)據(jù)大屏設(shè)計等,越來越多職業(yè)需要和數(shù)據(jù)打交道,如何選擇合適的數(shù)據(jù)可視化圖表,精準(zhǔn)的發(fā)掘數(shù)據(jù)背后的含義,讓數(shù)據(jù)說話顯得尤為重要。
根據(jù)可視化專家 Andrew Abela 對該數(shù)據(jù)關(guān)系分類方式的提煉,他提出將圖表展示的數(shù)據(jù)關(guān)系分為四類:比較、分布、構(gòu)成和聯(lián)系。我們在選用圖表前首先要想清楚:要表達(dá)什么關(guān)系。本文基于Andrew Abela的分類方法,結(jié)合公交及客流分析項目案例經(jīng)驗,重點(diǎn)介紹并補(bǔ)充了不同分類中較為常用的圖表及其使用的注意事項,力求讓大家更快捷準(zhǔn)確地掌握可視化設(shè)計圖表的用法。

比較(各項目的排名)
使用圖形的長度、寬度、位置、面積、角度和顏色來比較數(shù)值的大小,顯示一段時間內(nèi)的數(shù)據(jù)變化或顯示各項之間的比較情況——是差不多,還是一個比另一個更多或更少?
1.柱狀圖:
基礎(chǔ)柱狀圖,使用柱子顯示類別之間的數(shù)值比較。其中一個軸表示需要對比的分類維度,另一個軸代表相應(yīng)的數(shù)值。當(dāng)需要比較的數(shù)據(jù)條目較少時,一般可選用柱狀圖。
優(yōu)勢:柱形圖利用柱子的高度,能夠比較清晰的反映數(shù)據(jù)的差異,一般情況下用來反映分類項目之間的比較,也可以用來反映時間趨勢。
注意:柱形圖的局限在于它僅適用于中小規(guī)模的數(shù)據(jù)集,當(dāng)數(shù)據(jù)/分類太多時不易分辨。一般而言,不超過12個。
通常來說,柱形圖的橫軸是時間維度,用戶習(xí)慣性認(rèn)為存在時間趨勢。如果遇到橫軸不是時間維度的情況,可以用顏色區(qū)分每根柱子。
上圖是一個不同交通方式出行的圖表,展示不同出行方式的對比
2.條形圖:
當(dāng)需要比較的條目較多時(12以上),一般可選用條形圖,條形圖是橫向的柱狀圖,適合的展示數(shù)據(jù)不宜多余30條。
優(yōu)勢:當(dāng)條目過多或者項目的標(biāo)簽文本比較長時,橫軸空間有限,導(dǎo)致文本會出現(xiàn)重疊或傾斜,容易造成閱讀困難,而使用條形圖,文本可以橫向排布,便于用戶閱讀。

3.雙向柱狀圖:
雙向柱狀圖(又名正負(fù)條形圖),使用正向和反向的柱子顯示類別之間的數(shù)值比較。
上圖是某地客流量流入&流出對比圖,流入人口使用正向柱狀圖表示、流出人口使用反向柱狀圖表示
4.折線圖:
折線圖用來反映隨時間變化的趨勢。當(dāng)我們需要描述事物隨時間維度的變化時常常需要使用該圖形。 柱形圖強(qiáng)調(diào)各數(shù)據(jù)點(diǎn)值之間的差異,更適于表現(xiàn)離散型的時間序列;折線圖則強(qiáng)調(diào)起伏變化的趨勢,適合表現(xiàn)連續(xù)型的時間序列。所以當(dāng)時間序列的數(shù)據(jù)點(diǎn)較少時,可以使用柱形圖,而當(dāng)數(shù)據(jù)點(diǎn)較多時,則建議使用折線圖。
上圖表示不同月份的客流量
5.面積圖:
當(dāng)只展示數(shù)據(jù)的趨勢時,折線圖和面積圖完全等價,都可以使用,通常使用折線圖更多。
注意:當(dāng)在大型會議室展示數(shù)據(jù)時,即讀圖人離圖表可能較遠(yuǎn)的情況,使用面積圖能讓后排的人看的更清楚。當(dāng)比較多個度量數(shù)據(jù)的趨勢時,建議使用折線圖。如使用面積圖,則存在數(shù)據(jù)序列之間相互遮擋的情況,除了靠近橫軸的那個數(shù)據(jù)序列外,很難觀察出其他數(shù)據(jù)序列的變化趨勢。
上圖表示2015~2019年內(nèi)不同分類的人口出行方式
6.雷達(dá)圖:
雷達(dá)圖是一種表現(xiàn)多維(4維以上)數(shù)據(jù)的圖表,可以展示出數(shù)據(jù)集中各個變量的權(quán)重高低情況,非常適用于展示性能數(shù)據(jù)。
注意:(1) 如果雷達(dá)圖上多邊形過多會使可讀性下降,使整體圖形過于混亂。特別是有顏色填充的多邊形的情況,上層會遮擋覆蓋下層多邊形。
(2) 如果變量過多,也會造成可讀性下降,因為一個變量對應(yīng)一個坐標(biāo)軸,這樣會使坐標(biāo)軸過于密集,使圖表給人感覺很復(fù)雜。所以最佳實踐就是盡可能控制變量的數(shù)量使雷達(dá)圖保持簡單清晰。
上圖表示A路和B路兩公交路線的線路運(yùn)營評價雷達(dá)圖,分別從線路直達(dá)性、公交換乘率、高峰擁擠度、客流均衡性和出行速度比這五個維度進(jìn)行考核,可以看出兩條線路各方面都比較平衡
構(gòu)成(占總體的百分比)
主要關(guān)注每個部分所占整體的百分比,如果你想表達(dá)的信息包括:“份額”、“百分比”以及“預(yù)計將達(dá)到百分之多少”,這時候可以用到餅圖;
7.餅圖
餅圖廣泛得應(yīng)用在各個領(lǐng)域,用于表示不同分類的占比情況,通過弧度大小來對比各種分類。餅圖通過將一個圓餅按照分類的占比劃分成多個區(qū)塊,整個圓餅代表數(shù)據(jù)的總量,每個區(qū)塊(圓?。┍硎驹摲诸愓伎傮w的比例大小,所有區(qū)塊(圓?。┑募雍偷扔?100%。
優(yōu)勢:在一張餅圖上比較一個數(shù)據(jù)系列上各個分類的大小占比還是很方便高效的。
上圖是各種出行方式客流量情況
注意:餅圖不適用于多分類的數(shù)據(jù),原則上一張餅圖不可多于 9 個分類,因為隨著分類的增多,每個切片就會變小,最后導(dǎo)致大小區(qū)分不明顯,對于數(shù)據(jù)的對比是沒有什么意義的。所以餅圖不適合用于數(shù)據(jù)量大且分類很多的場景,可改選用條形圖進(jìn)行展示。
上圖是各個省的人口的占比情況,因為這張圖上包含的分類過多,就出現(xiàn)了簡介中提到的問題,很難清晰對比各個省份的人口數(shù)據(jù)占比情況,所以這種情況下,推薦使用橫向柱狀圖
分類占比差別不明顯的也需要慎重選擇用餅圖進(jìn)行數(shù)據(jù)展示,如下圖,各類別占比幾乎一樣,用戶無法看出數(shù)據(jù)差異,此時更建議使用柱狀圖展示。
相比于具備同樣功能的其他圖表(比如百分比柱狀圖、環(huán)圖),餅圖需要占據(jù)更大的畫布空間,且很難進(jìn)行多個餅圖之間的數(shù)值比較。
上圖中不同出行方式的客流量相近,所以不太適合使用餅圖,此時可以使用柱狀圖來呈現(xiàn)
8.環(huán)圖
環(huán)圖其本質(zhì)是餅圖將中間區(qū)域挖空。
優(yōu)勢:環(huán)圖相對于餅圖空間的利用率更高,可以使用它的空心區(qū)域顯示文本信息,比如標(biāo)題等。
注意:環(huán)圖與餅圖一樣,注意避免用于展示分類過多或者占比差別不明顯的數(shù)據(jù)。
上圖這種用法與餅圖類似,是不同出行方式的客流量情況
9.南丁格爾玫瑰圖:
南丁格爾玫瑰圖是在極坐標(biāo)下繪制的柱狀圖,使用圓弧的半徑長短表示數(shù)據(jù)的大?。〝?shù)量的多少)。
由于半徑和面積的關(guān)系是平方的關(guān)系,南丁格爾玫瑰圖會將數(shù)據(jù)的比例大小夸大,尤其適合對比大小相近的數(shù)值。
由于圓形有周期的特性,所以玫瑰圖也適用于表示一個周期內(nèi)的時間概念,比如星期、月份。
上圖是一個時間周期內(nèi)各國客流量的對比
10.堆疊柱狀圖
堆疊柱狀圖將每個柱子進(jìn)行分割以顯示相同類型下各個數(shù)據(jù)的大小情況。它可以形象得展示一個大分類包含的每個小分類的數(shù)據(jù),以及各個小分類的占比,顯示的是單個項目與整體之間的關(guān)系。
注意:堆疊柱狀圖的一個缺點(diǎn)是當(dāng)柱子上的堆疊太多時會導(dǎo)致數(shù)據(jù)很難區(qū)分對比,同時很難對比不同分類下相同維度的數(shù)據(jù),因為它們不是按照同一基準(zhǔn)線對齊的。
上圖顯示的是某地全方式日客流情況,通過堆疊柱狀圖,我們可以很清晰對比同一種客流量哪一天更大
分布(項目的頻率情況)
是關(guān)心各數(shù)值范圍內(nèi)各包含了多少項目,可以根據(jù)地理位置數(shù)據(jù),使用圖形的位置、大小、顏色的漸變程度來表現(xiàn)數(shù)據(jù)的分布,展示不同分布特征。
11.熱力圖
熱力圖尤其關(guān)注分布,它可以不需要坐標(biāo)軸,其背景常常是圖片或地圖,一般情況用專有的色系彩虹色系。
上圖是某地人口熱力圖,用于顯示地區(qū)人口分布
12.分級統(tǒng)計地圖
分級統(tǒng)計地圖是一種在地圖分區(qū)上使用視覺符號(通常是顏色、陰影或者不同疏密的暈線)來表示一個范圍值的分布情況的地圖。在整個制圖區(qū)域的若干個小的區(qū)劃單元內(nèi)(行政區(qū)劃或者其他區(qū)劃單位),根據(jù)各分區(qū)的數(shù)量(相對)指標(biāo)進(jìn)行分級,并用相應(yīng)色級或不同疏密的暈線,反映各區(qū)現(xiàn)象的集中程度或發(fā)展水平的分布差別,最常見于人口數(shù)據(jù)的可視化,這些數(shù)據(jù)以省、市登地理區(qū)域為單位。
上圖展示廣東省各市客流量情況
聯(lián)系(變量之間的關(guān)系)
主要查看兩個變量之間是否表達(dá)出我們預(yù)期所要證明的模式關(guān)系,比如預(yù)期銷售額可能隨著折扣幅度的增長而增長,這時候可以用氣泡圖來展示,用于表達(dá)“與……有關(guān)”、“隨……而增長”、“隨……而不同”變量間的關(guān)系;也可使用圖形的嵌套表示數(shù)據(jù)之間的關(guān)系,通常用于表示數(shù)據(jù)之間的前后順序、父子關(guān)系以及相關(guān)性。
13.散點(diǎn)圖
散點(diǎn)圖也叫 X-Y 圖,它將所有的數(shù)據(jù)以點(diǎn)的形式展現(xiàn)在直角坐標(biāo)系上,以顯示變量之間的相互影響程度,點(diǎn)的位置由變量的數(shù)值決定。
通過觀察散點(diǎn)圖上數(shù)據(jù)點(diǎn)的分布情況,我們可以推斷出變量間的相關(guān)性。如果變量之間不存在相互關(guān)系,那么在散點(diǎn)圖上就會表現(xiàn)為隨機(jī)分布的離散的點(diǎn),如果存在某種相關(guān)性,那么大部分的數(shù)據(jù)點(diǎn)就會相對密集并以某種趨勢呈現(xiàn)。數(shù)據(jù)的相關(guān)關(guān)系主要分為:正相關(guān)(兩個變量值同時增長)、負(fù)相關(guān)(一個變量值增加另一個變量值下降)、不相關(guān)、線性相關(guān)、指數(shù)相關(guān)等。那些離點(diǎn)集群較遠(yuǎn)的點(diǎn)我們稱為離群點(diǎn)或者異常點(diǎn)。
上圖對不同地區(qū)經(jīng)濟(jì)發(fā)展水平和客流量兩個維度進(jìn)行比較,可以看到所有的數(shù)據(jù)點(diǎn)比較集中,呈正相關(guān)關(guān)系,即經(jīng)濟(jì)發(fā)展水平越高,相應(yīng)的客流量會越大。
14.氣泡圖
氣泡圖是一種多變量圖表,是散點(diǎn)圖的變體,也可以認(rèn)為是散點(diǎn)圖和百分比區(qū)域圖的組合。
氣泡圖通常用于比較和展示不同類別圓點(diǎn)(這里我們稱為氣泡)之間的關(guān)系,通過氣泡的位置以及面積大小。從整體上看,氣泡圖可用于分析數(shù)據(jù)之間的相關(guān)性。
注意:氣泡圖的數(shù)據(jù)大小容量有限,氣泡太多會使圖表難以閱讀。但是可以通過增加一些交互行為彌補(bǔ):隱藏一些信息,當(dāng)鼠標(biāo)點(diǎn)擊或者懸浮時顯示,或者添加一個選項用于重組或者過濾分組類別。另外,氣泡的大小是映射到面積而不是半徑或者直徑繪制的。因為如果是基于半徑或者直徑的話,圓的大小不僅會呈指數(shù)級變化,而且還會導(dǎo)致視覺誤差。
上圖展示各大洲各個國家人均消費(fèi)總值、人均入境次數(shù)及人口的數(shù)據(jù)。其中橫坐標(biāo)表示人均消費(fèi)總值,縱坐標(biāo)表示人均出境次數(shù),氣泡的大小表示人口數(shù)量,然后用顏色來區(qū)分各個大洲??梢钥闯鋈司M(fèi)總值和人均入境境次數(shù)的相關(guān)性,大致呈正相關(guān),并且人均入境次數(shù)較多的地區(qū)主要集中在亞洲、歐洲和大洋洲
15.矩形樹圖
矩形樹圖采用矩形表示層次結(jié)構(gòu)里的節(jié)點(diǎn),父子節(jié)點(diǎn)之間的層次關(guān)系用矩形之間的相互嵌套隱喻來表達(dá)。從根節(jié)點(diǎn)開始,屏幕空間根據(jù)相應(yīng)的子節(jié)點(diǎn)數(shù)目被分為多個矩形,矩形的面積大小通常對應(yīng)節(jié)點(diǎn)的屬性。每個矩形又按照相應(yīng)節(jié)點(diǎn)的子節(jié)點(diǎn)遞歸的進(jìn)行分割,知道葉子節(jié)點(diǎn)為止。
優(yōu)勢:相比起傳統(tǒng)的樹形結(jié)構(gòu)圖,矩形樹圖能更有效得利用空間,并且擁有展示占比的功能。
注意:當(dāng)分類占比太小的時候文本會變得很難排布。相比起分叉樹圖,矩形樹圖的樹形數(shù)據(jù)結(jié)構(gòu)表達(dá)的不夠直觀、明確。
是客流歸屬地客流量預(yù)測分析
以上就是為大家介紹的圖表基本使用情況,適用于日常工作中大多數(shù)的圖表制作。希望大家都可以需要根據(jù)自己想要表達(dá)的信息選擇合適的圖表,讓數(shù)據(jù)可視化幫助我們的大腦減負(fù),替我們的數(shù)據(jù)說話。





上圖表示A路和B路兩公交路線的線路運(yùn)營評價雷達(dá)圖,分別從線路直達(dá)性、公交換乘率、高峰擁擠度、客流均衡性和出行速度比這五個維度進(jìn)行考核,可以看出兩條線路各方面都比較平衡
上圖是各種出行方式客流量情況
上圖是各個省的人口的占比情況,因為這張圖上包含的分類過多,就出現(xiàn)了簡介中提到的問題,很難清晰對比各個省份的人口數(shù)據(jù)占比情況,所以這種情況下,推薦使用橫向柱狀圖
上圖中不同出行方式的客流量相近,所以不太適合使用餅圖,此時可以使用柱狀圖來呈現(xiàn)
上圖這種用法與餅圖類似,是不同出行方式的客流量情況
上圖是一個時間周期內(nèi)各國客流量的對比
上圖顯示的是某地全方式日客流情況,通過堆疊柱狀圖,我們可以很清晰對比同一種客流量哪一天更大
上圖是某地人口熱力圖,用于顯示地區(qū)人口分布
上圖展示廣東省各市客流量情況
上圖對不同地區(qū)經(jīng)濟(jì)發(fā)展水平和客流量兩個維度進(jìn)行比較,可以看到所有的數(shù)據(jù)點(diǎn)比較集中,呈正相關(guān)關(guān)系,即經(jīng)濟(jì)發(fā)展水平越高,相應(yīng)的客流量會越大。
上圖展示各大洲各個國家人均消費(fèi)總值、人均入境次數(shù)及人口的數(shù)據(jù)。其中橫坐標(biāo)表示人均消費(fèi)總值,縱坐標(biāo)表示人均出境次數(shù),氣泡的大小表示人口數(shù)量,然后用顏色來區(qū)分各個大洲??梢钥闯鋈司M(fèi)總值和人均入境境次數(shù)的相關(guān)性,大致呈正相關(guān),并且人均入境次數(shù)較多的地區(qū)主要集中在亞洲、歐洲和大洋洲
是客流歸屬地客流量預(yù)測分析






















