精品推薦:VR如何引領(lǐng)數(shù)據(jù)可視化之變革
數(shù)據(jù)視覺化可以說是VR愛好者津津樂道的VR高端應(yīng)用之一,虛擬現(xiàn)實技術(shù)給這個領(lǐng)域帶來了非常深刻的影響。但具體如何影響?而現(xiàn)在的數(shù)據(jù)視覺化又存在哪些問題?本文致力于挖掘傳統(tǒng)數(shù)據(jù)視覺化存在的特定問題以及在表達抽象信息時遇到的挑戰(zhàn),并討論VR將如何改變這種情況。
Evan是虛擬現(xiàn)實數(shù)據(jù)視覺化公司Kineviz的一位項目經(jīng)理。此前,他曾作為一名數(shù)據(jù)科學(xué)家就職于HID Global,他畢業(yè)于加州大學(xué)伯克利分校,擁有認知科學(xué)領(lǐng)域的學(xué)位。在他為Kineviz工作之余,他喜歡探索VR,他研究并撰寫關(guān)于人類決策流程的文章。
1983年,Amos Tversky和Daniel Kahneman曾向?qū)W生們提問:
琳達是一位31歲的單身女性,她健談而開朗。她大學(xué)時主修哲學(xué)。作為學(xué)生時的她非常關(guān)注歧視和社會公平問題,并積極參與了反核活動。那么她最有可能:
1.琳達現(xiàn)在是一名小學(xué)教師?
2.琳達在一個書店工作,并參加瑜伽課程?
3.琳達熱衷于女權(quán)運動?
4.琳達現(xiàn)在是一位精神病學(xué)社會工作者?
5.琳達現(xiàn)在是美國婦女選民聯(lián)盟的成員?
6.琳達現(xiàn)在是銀行柜員?
7.琳達現(xiàn)在是保險推銷員?
8.琳達是一名銀行柜員,并熱衷于女權(quán)運動?
他們發(fā)現(xiàn)有86%的本科生認為第8個答案的可能性大于第6個,雖然根據(jù)上面的描述我們很容易聯(lián)想到琳達同時是銀行柜員與女權(quán)運動者的場景,但實際上女權(quán)銀行柜員只是銀行柜員的一種,很明顯她們的數(shù)量遠少于所有的銀行柜員。
這個案例不僅非常有名,大多數(shù)人還對此感到困惑。不過如果把它進行視覺化的話,我們就會發(fā)現(xiàn)其實非常好理解:
看了上面的圖表,各位覺得哪種情況更有可能:琳達是一個銀行柜員,還是一個女權(quán)銀行柜員?(假設(shè)兩個圓的尺寸與現(xiàn)實的比例相同)
虛擬現(xiàn)實可以使得這種概率估計更加容易,正如上面的圖表使得這個“琳達問題”變?nèi)菀滓粯印?
談?wù)摂?shù)據(jù)和虛擬現(xiàn)實的關(guān)系就有點像是著名的雞與蛋的關(guān)系——如果不知道人們要如何使用VR數(shù)據(jù)工具就很難構(gòu)建這樣一個VR工具。話雖這么說,虛擬現(xiàn)實仍有可能應(yīng)用于:
a.概率性思考(上面的例子)
b.高維度數(shù)據(jù)視覺化(自由度特別高的數(shù)據(jù),一維空間3個點的位置變化與三維空間1個點的位置在數(shù)學(xué)上是等價的,所以可以把非常復(fù)雜的變化轉(zhuǎn)換成更高維度上的簡單變化)
c.高數(shù)據(jù)密度
d.提供環(huán)境因素
高維數(shù)據(jù)視覺化
圖表對于優(yōu)秀的統(tǒng)計分析至關(guān)重要- F.J. Anscombe
假如你的數(shù)據(jù)集只有兩個維度或者更少,單獨的數(shù)據(jù)使用圖表就比較容易視覺化:
Anscombe著名的四重奏,信息來自Wikipedia。每個數(shù)據(jù)集有相同的均值、方差、相關(guān)性和最佳擬合曲線。
上述的每個數(shù)據(jù)集,所有X坐標的均值都是9,Y坐標的均值為7.5,X坐標的方差是11,X與Y的相關(guān)性是0.816,且最佳擬合曲線的公式是Y = 3 + 5x。
換句話說,這四個數(shù)據(jù)集似乎在統(tǒng)計上是等價的,盡管我們從視覺上對它們的本質(zhì)一目了然(并不相同)。別高興得太早,這個例子非常簡單,它只不過是二維數(shù)據(jù)集罷了。
如果你面對的是三維數(shù)據(jù),那么很顯然我們可以使用三維圖。如果你要面對高維數(shù)據(jù)(比如說你的excel表格中有大量列),這種方法顯然不能用。想象2D場景自然很容易,當(dāng)數(shù)據(jù)集中有很多列(比如10000列,只要多于3列)問題就會來了,三維以上的視覺化是不可能的任務(wù)。
不過,我們可以采用其他辦法來表示維度。以三角形為例,我們可以用它來表示三維數(shù)據(jù),我們可以用三角形邊長表示每個維度的數(shù)據(jù),如果你愿意,甚至可以用紅藍光譜或者深淺光譜來為三角中心上色,這樣就會有五個維度可供觀察。對比每個三角形,你或者就可以發(fā)現(xiàn)異?;蛟诖穗[藏的規(guī)律和關(guān)系。當(dāng)然,這只是個理論。
Herman Chernoff在70年代探索了這理論的一個變種:有別于三角形邊長,他用不同的卡通人物形象映射數(shù)據(jù)的維度。
大家可以通過下面這個《洛杉磯時報》中的信息圖判斷這種方法好不好:
Eugene Turner-洛杉磯的生活(1977)-《洛杉磯時報》。這里有四種表情,加上地理分布和社區(qū)信息,我們可以看到總計6個維度的信息。
你的第一反應(yīng)也許是對這種數(shù)據(jù)表示方法嗤之以鼻,它們看起來可笑,帶有一點種族歧視意味,并難以解釋。但我勸你不妨再嘗試一次,你會發(fā)現(xiàn)貧富社區(qū)間的緩沖帶。
切爾諾夫臉譜圖不能得到廣泛應(yīng)用的一大原因在于它們太卡通化了(科學(xué)通常都是嚴謹?shù)?,可能不太適合卡通臉譜圖)。盡管真人版的切爾諾夫臉譜圖可以解決太卡通化的問題,它卻存在另一個問題:也許這些臉譜本應(yīng)該是非常直觀的,但人們對真人的臉和表情太有經(jīng)驗了,反而有時候會困惑而無法客觀地進行評估。
看下面這個圖,上面是蘋果現(xiàn)任CEO蒂姆庫克的表情,他眉毛的傾斜程度,這張臉上的很多部位被用來表示蘋果歷年的財報數(shù)據(jù)。
作品來自Christo Allegra。蒂姆庫克臉部的不同部位展現(xiàn)了每年Apple的財務(wù)數(shù)據(jù)的不同情況。他鼻子的寬度用來表現(xiàn)Apple貸款額;他嘴巴的開合度表現(xiàn)營業(yè)額;眼睛的大小表現(xiàn)每股收益等等。更多切爾諾夫臉譜圖的應(yīng)用,詳見Dan Darling的成果。
很明顯,這種方法存在諸多問題。首先就是,臉部不是在任何情況都能傳達同等程度的情感信息的,“笑”這個動作就是如此。換句話說,我們對不同表情的印象并不絕對等同于財務(wù)數(shù)據(jù)情況。而這一點本應(yīng)該是圖標最大的魅力所在。這也是為什么用可視化的方法解決琳達問題會更加直觀。這也是現(xiàn)今存在的高維度數(shù)據(jù)可視化方法所缺失的一個特點。
虛擬現(xiàn)實技術(shù)可以解決上面所提及的眾多問題。不用面部表情,類似切爾諾夫圖譜的技術(shù)可以用來控制中性對象的觀察、移動、交互和分布。舉例來說,一張桌子的如下屬性能夠被用來表示不同的數(shù)據(jù)維度:高度、桌面的面積、顏色、腿長、桌子磨光度以及斑點和焊補的位置和種類。如果你有15個維度的數(shù)據(jù),你可以將維度轉(zhuǎn)化成能夠控制桌子外形的各種參數(shù)。
每一個測量值都會被用來對一個數(shù)據(jù)進行可視化,來自mycarpentry.com
VR的優(yōu)勢在于能夠讓你直觀而真實地感受到桌子所代表的含義,比方說它是另一張桌子的2倍高;抑或是桌面不同的摩擦系數(shù)。我們可以通過一些測試確保數(shù)據(jù)不同維度能夠以同樣的標準映射到桌子的不同參數(shù)。
此外,相關(guān)的方法論已經(jīng)在心理物理學(xué)和色彩感知領(lǐng)域得到了深度的研究——研究人員已經(jīng)花費很多時間測量人們?nèi)绾瓮ㄟ^不同的知覺感知微弱和巨大的差異。換句話說,VR和一些心理物理學(xué)能夠使了解復(fù)雜的數(shù)據(jù)變得像走進宜家一樣簡單。
高密度圖表
由于數(shù)學(xué)史上一些偶發(fā)的不幸,一些由點和連接線構(gòu)成的對象集合也被稱為圖表
此類圖表一般都以這樣的形式出現(xiàn):
維基百科的Prefuse(一種數(shù)據(jù)可視化工具)視覺圖,來自維基百科
圖表上的每一個點代表一個維基頁面,每一條線代表著頁面之間的聯(lián)系。
理論上來說,圖表在表達對象和數(shù)據(jù)點之間的關(guān)系時十分有用,特別是當(dāng)聯(lián)系的類別和數(shù)量不可忽視的時候。
舉例來說,下圖表示啤酒酵母細胞中基因間的每一次相互作用。
左:表示酵母基因組的節(jié)點和邊緣圖。右:重要的基因群。
盡管這的確很有趣,你肯定也注意到2張圖的中間區(qū)域都很密集。如果你去查看巴拿馬的一個數(shù)據(jù)集,會發(fā)現(xiàn)一些類似的情況——連接關(guān)系圖變得非常密集,難以分清。
事實上,大多數(shù)圖表在中心區(qū)域存在大量重疊連接圖形而變得難以理解,我們會無法辨清圖中對象的具體連接方式,而這本來是使用這一圖表最初的原因。
看到這里,相信你已經(jīng)能夠理解(相比2D)3D可視化圖形給高密度數(shù)據(jù)帶來的好處了吧。
大腦中不同神經(jīng)網(wǎng)絡(luò)的三維可視化圖形
但是,我們?nèi)匀恍枰⒁膺@些可視化圖形同樣會遭遇看起來太過繁雜的問題;盡管作者正用算法來將這些連接線“捆綁”在一起,要理清具體細節(jié)仍然非常困難。然而,想象一下,如果你能夠進入這些大腦的中心位置,可以迅速改變影像的大小——數(shù)據(jù)就會變得更容易解讀了。
提供環(huán)境因素
對比下列圖表:
兩者使用了完全相同的底層數(shù)據(jù)。但左圖被提名為2015年最具誤導(dǎo)性的圖表之一。
我認為盡管上面的圖表很有誤導(dǎo)性,但它的問題主要在于使用了靜態(tài)圖像。如果能夠改變數(shù)據(jù)大小,換一種形狀和尺度就可以防止誤導(dǎo)性出現(xiàn),因為環(huán)境因素已經(jīng)呈現(xiàn)在體驗內(nèi)部了。
用虛擬現(xiàn)實技術(shù)來可視化信息的一大優(yōu)勢在于它能夠分享的不僅僅只是靜態(tài)的VR場景;每一個VR場景本身都是一次無意識的體驗。這意味著觀看者可以按照自己的意愿去探索它。
盡管VR數(shù)據(jù)工具仍處在初期階段,但是我可以給你推薦3個提供上述功能的工具。
CalcFlow
首先就是CalcFlow,這個工具是加州大學(xué)圣地亞哥分校數(shù)學(xué)系為了可視化3D數(shù)學(xué)概念與其他人共同開發(fā)出來的。目前,它已經(jīng)具備一系列交互式Demo,它們能夠讓人對二重積分或納維爾-斯托克斯方程有直觀的了解。在這些Demo中,你可以體驗到我之前所提到的一些VR功能:改變尺度并在數(shù)據(jù)中“穿行”,這也意味著數(shù)據(jù)會更加容易理解。由于這些Demo具備很強的操作性,用戶可以在飛行中不斷調(diào)整數(shù)據(jù)可視方式,從多種不同的角度了解它如何影響最終結(jié)果。
DeathTools
DeathTools通過將抽象數(shù)字變?yōu)槲覀兛梢暂p松理解的更加真實的圖像來實現(xiàn)數(shù)據(jù)可視化,它的方法從根本上有別于傳統(tǒng)圖表。用這個工具我們可以看到近期中東沖突的累計尸體數(shù)量。不同于傳統(tǒng)柱狀圖,我們真實地站在一行行裝尸袋中間,這樣可以準確地了解死亡個體數(shù)。
正如DeathTools作者Ali Eslami所言:
我們的知識庫中缺失的一塊就是感知超大數(shù)字的能力或者方法。我們很難去理解和接受大規(guī)模死亡現(xiàn)象。舉例來說,像1;2;14;20;50這些是我們會經(jīng)常碰到的數(shù)字,我們很容易使用生活中常見的事物去代表這些數(shù)字所代表的含義。然后我們遇見如1000;10000;20000這樣的數(shù)字。這些數(shù)字會變得越來越難用概念來衡量,但是我們?nèi)匀荒軌蛲ㄟ^用可視化模型去理解這些數(shù)據(jù)的大致含義。
Kineviz
最后,我們正在研究支持VR的3D圖形化工具Kineviz。這個工具被設(shè)計來解決高信息密度的問題,并能夠讓用戶直觀地感受到數(shù)據(jù)間的差別。自己看看吧:
VR最主要的優(yōu)勢就是它能夠被用來更容易地呈現(xiàn)數(shù)據(jù)間的差別。VR還能夠使數(shù)據(jù)表達更具操作性,這意味著想要去改變數(shù)據(jù)表達來迎合一個特定的情形會越來越難。最終,VR通過結(jié)合用戶的空間感知使得人們能夠快速地調(diào)整人們所看到景象的尺度,最終實現(xiàn)人們原本難以想象的感知數(shù)據(jù)縮放的功能。
未經(jīng)授權(quán),禁止轉(zhuǎn)載,違者必將追究法律責(zé)任。
相關(guān)閱讀
-
絕贊中國風(fēng)!Vive VR玩轉(zhuǎn)“山海經(jīng)”妖獸
《山海獵人》以第一人稱視角體驗,將VR游戲特色射擊元素結(jié)合在一起,體驗效果明顯。游戲一共設(shè)有簡單、一般、困難三種游戲難度,隨著游戲通關(guān),會解鎖更多的道具和技能。...
- HTC聚焦內(nèi)容 VR電影《珍珠港》亮相圣丹斯電影節(jié)
- 少女胖次不保!《VR女友》最新預(yù)告突破下限
- 更多SteamVR將登場 Valve力推2代Vive基站
- VR玩的不只是刺激!PvP戰(zhàn)略游戲登陸Steam
- 地下城復(fù)活了!AR版D&D將成為下一個游戲爆款