改變世界還是忽悠?Magic Leap黑科技全解析
盡管宣稱不久就要上市,Magic Leap到現(xiàn)在為止仍然沒有放出關(guān)于他們所采用技術(shù)的任何細(xì)節(jié)。從我們知道的那一點來看,它采用了全新的系統(tǒng),具備消費者們常見的那些元件所無法比擬的功能。我們也不能因Magic Leap的保密主義而責(zé)備他們,畢竟還有很多公司虎視眈眈,想要弄清楚這個科技的原理并進行仿造。這聽起來簡直就是蘋果公司夢寐以求的技術(shù),一個能夠帶來真正革命性進步的全新產(chǎn)品。這也很像是微軟想要憑借HoloLens達(dá)到卻沒能真正完成的目標(biāo)。這一類型的科技產(chǎn)品從谷歌Glass眼鏡得到啟發(fā),并最終成為遠(yuǎn)超Glass的全新產(chǎn)品。
相信有非常多的人和我一樣,想要知道Magic Leap的產(chǎn)品究竟是怎么樣的?它如何發(fā)揮作用?我找遍了所有相關(guān)的訪談,專利,應(yīng)用設(shè)計以及在Magic Leap工作的人的背景資料等想要找到這一答案。
奧斯特豪特設(shè)計團隊ODG與BMW MINI合作設(shè)計的AR眼鏡,說不定Magic Leap的設(shè)備具有相似的外觀。
在深入那些資料細(xì)節(jié)之前,我們不妨先概述一下它將會是一個怎樣的產(chǎn)品。簡單來說,Magic Leap正在制造一款能夠?qū)⑻摂M物品投射到我們視場中去的設(shè)備,它產(chǎn)生的圖像的真實程度遠(yuǎn)超我們聽說過的任何其他同類產(chǎn)品。Magic Leap產(chǎn)品由兩部分組成:一副眼鏡和一個小型的投影/計算裝置,你可以把它想象為一個沒有屏幕的手機大小的盒子。這個盒子通過線纜與眼鏡相連。
這幅眼鏡的大小和外觀和現(xiàn)在人們常戴的那些差不多,當(dāng)然,嚴(yán)格來說它們還是要比我們平時使用的產(chǎn)品更笨重一點(畢竟內(nèi)含光學(xué)/電子元件)。這個超小尺寸的頭盔產(chǎn)品是這個裝置的基礎(chǔ)組成部分。這意味著它更容易被公眾接受,且具備與智能手機聯(lián)動的潛力。
這是一款移動電源,也許他們的計算單元就差不多是這個樣。
Magic Leap實現(xiàn)這樣一個極其輕便的眼鏡主要依靠將它的大部分組件從眼鏡端移到了一個獨立的單元上(相似的設(shè)計,VR端有Pico Neo;雙目AR端有影創(chuàng)Air)。舉一個相反的例子,HoloLens,盡管他們已經(jīng)將設(shè)備的重量和尺寸優(yōu)化到極致,仍然有好幾斤重(因為包括電池在內(nèi)的所有元件都在那個“頭箍”里面)。那么那個獨立單元包含哪些原件呢?
電池:它應(yīng)該具備匹敵甚至超過現(xiàn)代智能手機的電容量(看用途而定)。如果它想要取代智能手機,那就需要更多電量,至少要5000mAh。
SOC:主要指的就是CPU、GPU、RAM、基帶、ROM以及定制芯片等等。這里面當(dāng)然包括最新一代的移動處理器,目前來說就是高通的驍龍系列。因為是MR類產(chǎn)品,或者說更接近AR產(chǎn)品,它不像VR需要渲染整個場景,只渲染個別虛擬物品的話,計算量自然低很多。所以它并不像VR那樣需要異常強大的GPU。RAM的需求自然也與智能機同等水平,4G差不多了。AR眼鏡的一項核心技術(shù)就是即時定位與地圖構(gòu)建SLAM,它可以確定各種虛擬物品(以及使用者的頭部)在現(xiàn)實空間的位置。這個也是非常消耗計算資源的,所幸它可以采用專用處理芯片處理,不知道他們會自己定制芯片還是采用Movidius最新的Myriad 2 VPU芯片。
攝像頭:毫無疑問眼鏡上面會安置有若干個攝像頭,但這并不代表獨立單元上就沒有攝像頭。眼鏡上面的攝像頭主要用來進行SLAM探測,而獨立單元上的則是拍照用的。畢竟眼鏡上面空間極其有限,他們很難在上面集成高像素的攝像頭并配備優(yōu)質(zhì)的鏡頭組(比一般的攝像頭更大一些)。這對隱私問題也有幫助,這樣人們拍照時還是需要舉起手持裝置。
激光投影:這個就是Magic Leap與其他家完全不同的地方了。把這部分也從眼鏡上移下來的話可以使最終產(chǎn)品的尺寸和重量急劇縮小。影像將在口袋中的獨立元件中產(chǎn)生并通過線纜中的光纖傳送到眼鏡上,文章后面將會有一段專門討論這個技術(shù)的工作原理。
Magic Leap公司著名的鯨躍出水面的特效,正是這段視頻引發(fā)了人們對其產(chǎn)品的無限遐想。
在我們列舉了所有能夠塞到口袋中的元件之后,那么頭頂上的眼鏡里還剩些什么呢(這些都是不可能移出的)?
IMU(慣性測量單元):也就是傳統(tǒng)的三軸陀螺儀,三軸加速度計和三軸電磁傳感器,它們用來檢測頭部轉(zhuǎn)動。
耳機:也許他們會采用Google Glass的骨傳導(dǎo)方案(好處是方便,缺點是音質(zhì)渣)。這也算是一種人體工程學(xué)吧。骨傳導(dǎo)的另一個優(yōu)點就是它不會阻斷外界的聲音。
麥克風(fēng),光學(xué)鏡片和攝像頭:他們所采用的光學(xué)鏡片和攝像頭都是非常特別的元件,所以讓我們仔細(xì)來瞧一瞧吧:
光學(xué)鏡片:
從他們的專利申請書上我們可以知道,Magic Leap使用的鏡片相比HoloLens和Google Glass上使用的傳統(tǒng)投影裝置有極大的體積優(yōu)勢。上面的圖片展示的光源和頭盔本體是分開的,這也是為什么我們會在前面猜測光源是安置在獨立單元的原因。
另外,它展示的透鏡系統(tǒng)極其微小。專利申請書上的是概念演示,自然不代表它實際的尺寸,它所代表的是各組件大概的尺寸。不過他們曾經(jīng)展示過一塊光子晶片,將它對比圖中的組件5,6,7和8的寬度,我們就能了解整個裝置的大概尺寸了。
那么這究竟是怎么回事?他們是如何把光學(xué)系統(tǒng)縮至如此大小同時還提供所謂的高分辨率、效果驚人的光場顯示的?秘密在于這兩個方面:光纖掃描顯示和光子化光場芯片。
光纖掃描顯示:
這個顯示技術(shù)依靠一個全新的顯示系統(tǒng),此前從未應(yīng)用到任何消費級電子產(chǎn)品中。我們所知道的關(guān)于這個技術(shù)的所有細(xì)節(jié)都來自于2013年的一份專利申請書中。
這個專利是幾年前申請的了,所以有關(guān)這個系統(tǒng)實現(xiàn)的具體細(xì)節(jié)可能已經(jīng)發(fā)生了一些改變,不過其根本原理肯定是不會變的。這個系統(tǒng)使用一根震動的光纖掃描比光纖直徑大得多的圖像,它有點像那種老式的顯像管電視機。只不過掃描的不是電子,而是光源本身。
它使用一個壓電傳動裝置來實現(xiàn)這個掃描,這個裝置可以維持約24kHz頻率的掃描速率。當(dāng)然,我們實際到不了那種程度的速率,因為它需要進行多層掃描(專利上舉例是250圈)生成一個完整的圖像幀。這將改變我們對分辨率的定義。在這個系統(tǒng)中,分辨率與光纖的掃描速率有關(guān),光纖能夠聚焦的最小點徑(這個被定義為一個像素點),為了生成一個完整的圖像幀所需要掃描的次數(shù)和幀率。最終我們所獲得的圖像究竟能比現(xiàn)有的設(shè)備清晰多少依賴于他們在專利申請之后到底做了多少優(yōu)化工作。
將若干光纖掃描單元集成到一塊兒可以擴大顯示區(qū)域,每根管子直徑為1mm。
分辨率和幀率對于獲得一個最終的超逼真的全息圖像自然是非常重要,但視野也同等重要。關(guān)于這一點,讓我們來看看專利書上這段有意思的描述吧:
“這個頭顯裝置的視野(FOV)將會由微型顯示器圖像大小和鏡片本身共同決定。人類的視覺系統(tǒng)的FOV總共大約有200度水平:130度水平(原文就是這樣),但是大多數(shù)頭顯只能提供約40度的FOV。一個視敏度水平20/20(正常視力)的人能夠識別的極限角坐標(biāo)分辨率大約是50-60角秒(角度單位,1度為60角分,1角分為60角秒),并且這一點由微型顯示器的像素密度決定。為了最大程度上匹配人類視覺能力的平均值,一個頭顯應(yīng)當(dāng)在滿足20/20視敏度的前提下提供超過40度:40度FOV的圖像,所以以50角秒的角坐標(biāo)分辨率來換算就相當(dāng)于約800萬像素(4K)。要將它擴展到120度:80度FOV需要將近5000萬像素(nK?)。”
這里點明了兩件事。第一是為了將FOV提高到理想的水平,我們的消費級顯示屏幾乎落后于需求整整一個數(shù)量級。所以我們明白了要讓HoloLens提高一點視場角究竟有多困難。第二是我們知道了Magic Leap的目標(biāo)。他們想要提供一個120度80度的FOV。這遠(yuǎn)比Oculus Rift提供的FOV還要大,并且是在遠(yuǎn)高于它的分辨率的前提下。那么他們能夠夠做到這一點嗎?這很難說,不過專利的確給了我們一點希望,同時要記住這是3年前的專利,他們肯定已經(jīng)在此基礎(chǔ)上做了更多改進。
所謂像素間距,就是一個像素點中心到另一個像素點中心的距離,它對于分辨率是一個限制因素。傳統(tǒng)的微型顯示器,例如HoloLens使用的那種,其像素間距大約是4-5微米。這限制了這些顯示器的分辨率同時也限制了最終獲得的視場角。Magic Leap的專利暗示他們的光纖掃描技術(shù)能夠?qū)⑺s小到0.6微米,這幾乎減小了一整個數(shù)量級。
那么這意味著他們理論上能獲得怎樣的分辨率?他們舉例說是4375*2300(4K),這是專利中一個區(qū)間的分辨率,而這并不是全部。因為他們現(xiàn)在已經(jīng)開始考慮多芯光纖,用以繼續(xù)提高分辨率水平了。我相信他們能夠獲得更高的分辨率,如果我們想要更高的視場角,這是非常必要的。
最后,關(guān)于他們期望的視場角的問題這邊有一段話有所提及:
“上面描述的這一技術(shù)將帶來一個極高分辨率的顯示器,它將為頭顯或其他近場顯示裝置帶來一個更大的FOV?!?/span>
我認(rèn)為這意味著我們最終會獲得一個遠(yuǎn)大于40度的FOV,不過我們也不必這么樂觀的認(rèn)為它真的能達(dá)到120度,我覺得90度就差不多了。
光子化光場芯片:
當(dāng)我第一次聽到羅尼奧博維茲將他的鏡片稱為“光子化光場芯片”時,我不屑一顧。這不就是給某個早就存在技術(shù)重新起了一個高大上的名字嗎?不過我越是深入調(diào)查,越是發(fā)現(xiàn)它的確不是一塊普通的鏡片。那么,它究竟是什么原理?它究竟比普通鏡片牛在哪里?讓我們來討論一下衍射光學(xué)元件吧。
衍射光學(xué)元件(DOEs)可以被認(rèn)為是一個非常薄的“柔性焦距鏡頭組”,它可以進行光束成型,光束分離和漫射或均質(zhì)化。Magic Leap利用線性衍射光柵配合圓鏡片將光波波陣面進行分離并生成任何想要焦距的光束。也就是說它可以將光導(dǎo)入你的眼睛并保持正確的焦平面。但是俗話說得好,說起來容易做起來難,而它說起來也不容易。我讀的那份專利文件非常冗長,即使?jié)饪s了也要說好久。
為了構(gòu)建一個光場,Magic Leap使用了兩種獨立元件構(gòu)建一塊光子晶片。前者(圖示6)獲取入射光并將它導(dǎo)入后者(1),后者將它重定向到你的眼睛。
兩者都采用了DOEs技術(shù)。DOEs最大的缺點在于它只能完成非常特定的功能。它們不適用于不同波長的光,它們也不能改變焦點。
為了解決這個問題,Magic Leap將多種不同的DOEs層疊到了一個更大的透鏡組件,這樣就獲得了一個能夠適用于各種波長和不同焦點的元件。這些DOEs極薄,它們與相應(yīng)光的波長處在同一個尺度,所以它們的多少不影響裝置的厚度。下面就是這個光學(xué)系統(tǒng)的秘密所在。Magic Leap可以隨意打開或關(guān)閉不同層的DOEs(應(yīng)該是微機電系統(tǒng)吧,MEMS)。這樣他們就能夠調(diào)整最終進入你雙眼的光的光路了。最終,他們能夠調(diào)整圖像的焦點并獲得一個真正的光場。專利寫道:
“例如,裝置上的第一個DOE裝置,當(dāng)它打開,觀看者將看到一個視覺距離在1m左右的圖像;而當(dāng)?shù)诙€DOE裝置打開的時候,又會產(chǎn)生一個視覺距離在1.25m的圖像?!?
看起來如果我們想要獲得全范圍的焦平面圖像,這個裝置必須集成不計其數(shù)的DOE層,這不是限制非常大嗎?實際上并非如此。不同DOEs組合使用也會產(chǎn)生不同的輸出效果。所以這并不是一個DOE生成一個焦平面,而是一個DOEs組合生成一個焦平面(高中學(xué)過排列組合吧,這個數(shù)目是非常巨大的)。
下面的一個GIF動畫展示出了這個光子化光場芯片的運作原理。實際的層數(shù)肯定比動畫演示的要多,至于究竟有多少,我不知道。
最后,我們來看看Magic Leap過去聲稱的用光來產(chǎn)生黑色效果是如何實現(xiàn)的吧。如果我們在鏡片的外緣和內(nèi)緣各放置一個DOE,我們就可以用它們來抵消掉外界光(波長相同,相位相反),這個實際上跟耳機降噪的原理是一樣的(或者說跟某大爺用低音炮抵消廣場舞噪音相同)。文件描述:
那么,為什么我們把這個稱為芯片?典型的電子芯片可以根據(jù)需要改變電子流。而光子化光場芯片可以根據(jù)特定的參數(shù)改變光子通路,我覺得它可以算作是一種光子芯片了。
接下來還有什么需要解釋的?我們有了一塊光子化光場芯片,一個高分辨率的投影儀,但是我們到底是如何生成這個圖像的呢?它是通過合成來實現(xiàn)的。這個圖像是分層的,然后不同的組件在一個基礎(chǔ)平面上投射出不同焦距的圖像。也就是說,單單一幀畫面就由多層組合而成,每一個焦平面都是單獨的。
相機:
Magic Leap在相機技術(shù)方面要滿足3個目標(biāo)。第一個是顯而易見的,一個能夠拍攝尋常畫面的相機。這個就是普通相機技術(shù)所追求的,他們使用普通智能手機中的傳感器就可以實現(xiàn)了。不管最終這個攝像頭是裝在眼鏡上也好,還是裝在獨立元件上也好,總之我們可以用它來拍攝正常的圖片。
而另兩個應(yīng)用案例就比較有意思了。一直以來,Magic Leap都不斷宣稱他們的設(shè)備具備理解周圍環(huán)境的能力。在一次采訪中,他們提到這個裝置能夠識別物體,例如一把刀或一個叉子。為了做到這一點,他們需要一組相機。在這一點上,我們可以以HoloLens為例,它在這方面實現(xiàn)的相當(dāng)不錯。HoloLens擁有一組4個環(huán)境感應(yīng)攝像頭配合一個景深相機。讓我們來看看Magic Leap專利文件的圖片。
這個圖片展示了分布在眼鏡左右兩個鏡腿上的兩個組件。上面的是左鏡腿,下面的是右鏡腿。我們可以在圖中看見兩個朝外的攝像頭,標(biāo)有“world camara”字樣。同時,文件暗示了可能實際上不只有兩個(每側(cè)各有一個或多個攝像頭)。目前,我們不知道究竟會有多少。我們知道的是會有若干個攝像頭安裝在眼鏡上,而它們對于SLAM的最終效果至關(guān)重要。
最后一個應(yīng)用也能在上面的圖中看到。至少有2個攝像頭會指向你的眼睛。這是用來實現(xiàn)眼球追蹤的,這樣設(shè)備才能知道你的焦點和方向落在什么位置。還會有一個紅外LED燈珠安置在你的眼睛上方,這樣攝像頭才能檢測到你的眼睛的動作。這個眼球追蹤功能對用戶界面也非常重要。我認(rèn)為在于Magic Leap設(shè)備的交互中,“你在看什么?”是非常重要的。它很有可能取代普通電腦中鼠標(biāo)的作用。
說了這么多,其實最終仍然只是我的猜想,我也絕對不可能去證實這一點(Magic Leap保密制度)。但是我認(rèn)為所有的這些觀點都是有理有據(jù)的,它應(yīng)該非常接近Magic Leap的最終產(chǎn)品了。不管Magic Leap最后有沒有獲得商業(yè)上的成功,它也是最近這么些年難得一見的真正意義上的技術(shù)革命。我非常想知道他們最終能夠走到什么地步。
另外,要說Magic Leap有什么缺失的功能,那大概就是表情(面部)識別了,其原理上應(yīng)該與眼球追蹤差不多。
這篇文章的英文原文在Magic Leap-focused博客(Twitter: @gpuofthebrain)。
未經(jīng)授權(quán),禁止轉(zhuǎn)載,違者必將追究法律責(zé)任。
文章點評
相關(guān)閱讀
-
微軟頭顯遲遲未上市 仍需增加互動要素
HoloLens對我們來說已經(jīng)不是新東西了,但自從它面世以來一直都沒有出過消費者版,供廣大消費者體驗。不少開發(fā)者認(rèn)為,也許微軟一開始瞄準(zhǔn)的就不是個人市場,真正適合這款頭顯的也許是企業(yè)與開發(fā)者。...
- 5到10年,F(xiàn)acebook CEO不相信AR短期能普及
- 不只是VR,阿里邀請Magic Leap帶來AR購物
- AR愛好者的福音!世界首個AR運動登陸上海
- 單目AR眼鏡都賣到哪里去了?Vuzix M300開啟產(chǎn)業(yè)合作
- 手游提升熱度?口袋妖怪將被改編真人電影