所屬欄目:科技

提振數字經濟:虛擬現實技術的歷史沿革與前景剖析(下)

在上篇《提振數字經濟:虛擬實境技術的歷史沿革與前景剖析》中,我們解讀了虛擬實境技術的技術演進,並釐清了其中的關鍵要素,本篇我們重點圍繞如何實現產研融合進行深度解讀,全方位評估這一新興戰略方向的巨大潛力。

打破重重製約 「鏈」動產業發展

儘管虛擬實境技術在場景應用、產業生態等方面持續擴張,取得了一系列階段性成果。但是,這一產業仍有待解決的技術突破難題。電池技術、近眼顯示技術、感知交互技術,是阻礙 VR 技術發展的三重限制。其中,除了電池技術是眾多行業的底層制約外,後兩者對虛擬實境領域均有特殊性。

VR 技術的三大制約因素

>> 光學技術:多項核心參數之間的矛盾

如上期所述,光學層面影響著用戶的感官體驗,如視場角(FOV)大小代表著光學儀器的視野範圍,過低的刷新率(FPS)則會帶來暈眩感等。據此進一步分析,光學層面的核心問題其實是解析度(清晰程度)、視場角(視野範圍)、重量體積(美觀舒適)存在的潛在衝突。

VR 頭顯的光學示意圖

由於 VR 設備的分屏播放、球面渲染的實際解析度會遠遠低於面板的解析度,所以對屏幕像素密度(PPI)有著較高的要求。例如,普通視頻可分為480P、720P、1080P 等不同的解析度格式,相對應的,VR 設備要進行屏幕像素對齊,視頻播放率須達到8k、12k。然而,當前主流的 VR 視頻流還停留在2K、4K 階段,無法滿足需求。

從 PPI 的角度來說,普通手機屏幕大約在300ppi。VR 要達到人類肉眼看手機的清晰度,則需要近眼顯示屏達到2000ppi 左右,這同樣是一項超出現有水平的需求。

多項難題使近眼顯示方向面臨兩大核心問題,一方面,沒有合適的屏幕承載極高的解析度和像素密度;另一方面,不具備對視頻進行解碼、傳輸算力以及技術的能力。

>> 感知交互技術:算法精度有待提升

在感知交互方向,虛擬實境領域主要涉及兩項技術:同步定位與建圖技術(SLAM)、手勢交互技術。

SLAM 指在陌生的環境中,能夠精準建立時空對應關係,並回答「我在哪裡」「這是什麼地方」「我該怎麼走」等問題,換言之即完成定位、建圖和路徑規劃。

現階段,實現 SLAM 的方式有多種,主要分為 outside-in tracking(外向內追蹤)和 inside-out tracking(內向外追蹤)。前者會在制定空間內部署光學定位器,例如 HTC VIVE;後者則在 VR 頭顯上內置若干個(一般2~4個)攝像頭,基於三角定位原理計算空間位置,例如 Quest、Pico、奇遇等主流一體機。

inside-out vs outside-in

手勢交互分為基於手柄的非裸手交互控制、基於攝像機視覺算法的裸手交互。其中,裸手交互的硬體方案包括 RGB 攝像頭、3D 攝像頭(TOF、結構光、雙目視覺)和數據手套(傳感器)。

可以明確的是,目前不管 SLAM還是手勢交互,均無法滿足 VR 的高需求,主要技術限制存在於算法精度層面。

技術制約是產業發展的必考題,值得一提的是,就 VR 行業的技術趨勢而言,虛擬實境技術已經過了「泡沫幻滅期」,進入「緩慢爬升期」,並且即將進入「穩步增長期」。

虛擬實境技術已經在國內外形成了複雜且完備的產業鏈,技術的價值出口已經初步打開並擴大。當前,虛擬實境技術產業鏈一共分為4個分段,分別是硬體、軟體、內容、以及應用(場景),而每個分段又有不同的子方向構成。

虛擬實境技術產業鏈一覽

由此可見,虛擬實境技術已經邁入了廣泛的產業化進程,這是一個不可逆的、令人興奮的進程。

釋放發展動能 明確關鍵支撐

虛擬實境技術是信息三維化中的一環,而信息技術的載體則是內容。因此,虛擬實境產業的本質是 VR 內容的生產和消費。

從增長飛輪的維度來看,當前虛擬實境產業正處於高速運轉的模式:首先需要生產更多適配場景的 VR 內容,進而通過滿足消費場景來增加用戶或者說服客戶;待買家增多後,吸引更多 VR 內容的製作者,從而依靠技術生態支持更多基礎技術及 VR 內容工具的投入,以幫助內容生產者實現降本增效,提升 VR 內容單位固定成本的盈利。

在這樣的良性循環下,收益見漲,更多 VR 內容將被生產,從而開啟下一次的飛輪運轉。

VR 內容的增長飛輪

圍繞 VR 內容的生產和消費,三大核心技術——數據三維化、交互多人化、渲染雲端化打造穩固的支撐底座。

數據三維,即如何低成本地生產三維化數據,或者如何低成本地將海量現存的二維數據三維化。該技術的作用在於降低VR 內容的生產成本。

數據三維化的核心要素是算法層面的,以及其上下遊採集、定位、算力調度等技術,主要的技術要素包括:基於 GRB 的三維重建算法、GPU 加速技術(如CUDA)、通用背景摳除算法、採集設備光學能力、SLAM 算法。

一種基於多角度 RGB 圖像進行三維重建的算法示意

交互多人化,即基於三維數據的感知之外,賦予 VR 內容真實的交互反饋,乃至社交體驗。人的沉浸體驗來自於對三維世界的感知,以及和世界的交互反饋。交互多人化的作用在於提升 VR 內容的消費體驗。

交互多人化將虛擬實境技術的體驗推向了虛擬的數字平行世界,是虛擬實境技術與元宇宙結合的天然銜接,其中的主要技術要素包括:大規模狀態同步、視覺(虛擬形象)、語音語義、音視頻、區塊鏈、智能導航。

百度推出的首個國產元宇宙產品希壤

渲染雲端化,即基於集中的、雲端的算力池子進行遠端計算,終端渲染。信息密度、可交互度的提升,對應的是對終端算力、顯示器件的要求提升。虛擬實境技術要成為主流的大眾科技,就不能囿於高性能終端,渲染雲端化的作用在於擴展 VR 內容的消費場景。

渲染雲端化的核心要素主要集中在大規模後臺集群方向、以及音視頻方向,主要包括:分布式容器、流化技術、邊緣計算、音視頻、5G。

百度 VR 推出的雲渲染解決方案

虛擬實境技術是典型的經過長期構思、積累,最終在各項底座依賴相對成熟後,厚積薄發的技術方向。當前,作為信息三維化浪潮的核心載體技術,虛擬實境產業需求旺盛,行業應用朝著更為豐富化、多元化邁進,在產業落地的道路上穩健前行,正在逐步進入穩步發展期。

特別是,隨著元宇宙概念的興起和產品技術實踐的熱潮,虛擬實境技術迎來更加廣闊的未來方向,那就是成為元宇宙領域的容器型基礎技術。面向未來,百度智能雲將持續攻關,加速虛擬實境技術落地,並為技術進步、行業發展、生態圈壯大躬身前行,驅動數字經濟發展和產業轉型升級

相關信息

GG