杀手级VR社交应用之所以到现在仍然未能出现,自然不是从业者在吊消费者胃口,当然也不是消费者抵触VR社交。原因无他,技术上有瓶颈罢了。
现阶段的VR社交,已经完成了针对社交对象的位置、方向、基本姿态、头部位置等的跟踪。这样的VR社交,已经可以给参与者极强的社交体验,但这只是VR社交的开始,还远远不是未来。如果将VR社交的发展分代的话,这充其量也就是个第一代而已,还只满足了最基本的需求:可以和对方交流,能看见自己的手和对方的头与手等等。
真正的顶级VR社交体验,应该是:在虚拟环境中,你能和社交对象交流,你能看见Ta并你能感受Ta,你能感受Ta在你背后和你交流的时候在看着你,Ta微笑或悲伤的时候你能感受到Ta的不同表情,当你转头的时候或注意力在某点上的时候,Ta能感受到你的注意力所在等等。
社交参与者在虚拟环境中获得真实环境中一样的体验,才是VR社交的杀伤力所在。
要让VR社交火力全开的技术难点主要在于三个方面:
1、Avatar重现;
2、脸部表情追踪;
3、现实场景的还原。
一、Avatar重现
这是VR社交的最关键点,因为一旦创造出与真实身体完全同步(延迟低到大脑自动忽略)的Avatar,社交参与者便可以通过操控身体来改变社交对象的社交感受。
Avatar重现需要追踪你的脸部表情以及身体的每一个部位的反应,而且这种追踪与重现都是实时的,所以才能在技术上显得困难重重。技术上的难点主要在于:追踪与重现的延迟、设备(PC、一体机VR头盔)的数据处理能力、追踪传感器敏感精度、社交网络的带宽等等。举个例子说,在社交过程中,你的微笑需要被传感器追踪到,在设备的数据处理后,经由高速宽带网络传输至社交对象的VR设备中并被在其虚拟环境中重现。其中的任何一个环节都不能出现纰漏,否则社交对象便不能获取你们交流过程中可能致关重要的一个微笑。极致体验从来都是在最细节处获取的!
微软最新型的3D捕捉技术Holoportation,配合Hololens这样的混合现实显示设备,已经可以实现人的高清3D模型实时扫描、压缩、传送、重构,可以算作Avatar重现的一个雏形。
二、脸部表情追踪
脸部表情的追踪实际上是Avatar重现的分支,之所以单独将其列出来就是因为其技术难度非常高。有多难呢?完整精准的实现脸部表情追踪,需要涉及的学科包括:CV、传感器、机械学、电子、心理感知、机器学习、面部动画……笔者评判一项技术的复杂程度向来遵循一个非常简单的标准:涉及的学科广度。一项技术涉及的学科跨度太宽,毕竟光是将各学科整合起来都不是一个简单的事情。
南加大助理教授黎颢在一次采访中讲述了Oculus和南加大合作的SIGGRAPH(SpecialInterestGroupforComputerGRAPHICS)计划的产品,该计划的产品主要用来面部识别。其中的技术要点不在这里一一赘述,仅向大家讲述一个通俗易懂的难点——在VR中用户的头部被HMD遮挡住了,使得在VR中实现面部表追踪与往常的情况不再一样。
研究者们将上面的芯片镶嵌在上图中的泡沫板里(即黄色标记部分),通过感应面部肌肉的抽动来捕捉你脸上部的表情,瞬间觉得好高端有木有!前面伸出的相机,原理则和往常一样,通过镜头来追踪用户的下巴和嘴的表情。从技术上论证的话,SIGGRAPH已经基本实现了在VR社交中的面部表情追踪,但从聪明的你一眼就可以看出,这样的设备远不能实现面部表情完美追踪与重现。单是这个设备的外形,想必都会让大家看的尴尬癌直犯吧,用户的使用体验就更加不用说了。
三、现实场景的还原
VR社交的实现,必然是以特定的形式比如VR小游戏或者VR化的微信等等,这就涉及到了社交场景的构建。
现实场景虚拟重现在虚拟现实技术中有着重要的作用,它是基于全景图像的真实场景虚拟现实技术然后通过计算机技术实现全方位互动式观看的真实场景还原展示方式,通过VR眼镜可以前后左右远近的观看能够产生身临其境的感觉。对场景的重建,势必要求真实场景的全方位扫描、3D建模、数据传输、场景内容的材质/光线还原等等多方面的因素齐备。
淘宝即将上市的Buy+就使用虚拟现实技术,宣称能100%还原真实场景,并且能够利用TMC三维动作捕捉技术捕捉动作并触发虚拟环境的反馈。但实际上,现有的技术是完全能够做到静态现实场景的虚拟现实还原的,难点在于,如何实现动态还原。静态的还原撑破天也就是个街景地图而已,能够给予参与者的社交体验还远远不够。而如果希望实现动态画面,又涉及大量的3D建模工作,对于VR硬件的GPU性能也是一种考验。好消息是,最近,针对VR设备,AMD推出新的技术标准,包括120度视角,20ms延迟,以及16k的分辨率!
技术革新的推动力从来都是巨大红利的诱惑,虚拟现实社交的到来是必然,作为流量的最大入口,即便技术难度再高,从业者总不会放弃这片巨量金矿。
杀手级VR社交应用之所以到现在仍然未能出现,自然不是从业者在吊消费者胃口,当然也不是消费者抵触VR社交。VR日报一向一针见血无他,技术上有瓶颈罢了。
现阶段的VR社交,已经完成了针对社交对象的位置、方向、基本姿态、头部位置等的跟踪。这样的VR社交,已经可以给参与者极强的社交体验,但这只是VR社交的开始,还远远不是未来。如果将VR社交的发展分代的话,这充其量也就是个第一代而已,还只满足了最基本的需求:可以和对方交流,能看见自己的手和对方的头与手等等。
真正的顶级VR社交体验,应该是:在虚拟环境中,你能和社交对象交流,你能看见Ta并你能感受Ta,你能感受Ta在你背后和你交流的时候在看着你,Ta微笑或悲伤的时候你能感受到Ta的不同表情,当你转头的时候或注意力在某点上的时候,Ta能感受到你的注意力所在等等。
社交参与者在虚拟环境中获得真实环境中一样的体验,才是VR社交的杀伤力所在。
要让VR社交火力全开的技术难点主要在于三个方面:
1、Avatar重现;
2、脸部表情追踪;
3、现实场景的还原。
一、Avatar重现
这是VR社交的最关键点,因为一旦创造出与真实身体完全同步(延迟低到大脑自动忽略)的Avatar,社交参与者便可以通过操控身体来改变社交对象的社交感受。
Avatar重现需要追踪你的脸部表情以及身体的每一个部位的反应,而且这种追踪与重现都是实时的,所以才能在技术上显得困难重重。技术上的难点主要在于:追踪与重现的延迟、设备(PC、一体机VR头盔)的数据处理能力、追踪传感器敏感精度、社交网络的带宽等等。举个例子说,在社交过程中,你的微笑需要被传感器追踪到,在设备的数据处理后,经由高速宽带网络传输至社交对象的VR设备中并被在其虚拟环境中重现。其中的任何一个环节都不能出现纰漏,否则社交对象便不能获取你们交流过程中可能致关重要的一个微笑。极致体验从来都是在最细节处获取的!
微软最新型的3D捕捉技术Holoportation,配合Hololens这样的混合现实显示设备,已经可以实现人的高清3D模型实时扫描、压缩、传送、重构,可以算作Avatar重现的一个雏形。
二、脸部表情追踪
脸部表情的追踪实际上是Avatar重现的分支,之所以单独将其列出来就是因为其技术难度非常高。有多难呢?完整精准的实现脸部表情追踪,需要涉及的学科包括:CV、传感器、机械学、电子、心理感知、机器学习、面部动画……笔者评判一项技术的复杂程度向来遵循一个非常简单的标准:涉及的学科广度。一项技术涉及的学科跨度太宽,毕竟光是将各学科整合起来都不是一个简单的事情。
南加大助理教授黎颢在一次采访中讲述了Oculus和南加大合作的SIGGRAPH(SpecialInterestGroupforComputerGRAPHICS)计划的产品,该计划的产品主要用来面部识别。其中的技术要点不在这里一一赘述,仅向大家讲述一个通俗易懂的难点——在VR中用户的头部被HMD遮挡住了,使得在VR中实现面部表追踪与往常的情况不再一样。
研究者们将上面的芯片镶嵌在上图中的泡沫板里(即黄色标记部分),通过感应面部肌肉的抽动来捕捉你脸上部的表情,瞬间觉得好高端有木有!前面伸出的相机,原理则和往常一样,通过镜头来追踪用户的下巴和嘴的表情。从技术上论证的话,SIGGRAPH已经基本实现了在VR社交中的面部表情追踪,但从聪明的你一眼就可以看出,这样的设备远不能实现面部表情完美追踪与重现。单是这个设备的外形,想必都会让大家看的尴尬癌直犯吧,用户的使用体验就更加不用说了。
三、现实场景的还原
VR社交的实现,必然是以特定的形式比如VR小游戏或者VR化的微信等等,这就涉及到了社交场景的构建。
现实场景虚拟重现在虚拟现实技术中有着重要的作用,它是基于全景图像的真实场景虚拟现实技术然后通过计算机技术实现全方位互动式观看的真实场景还原展示方式,通过VR眼镜可以前后左右远近的观看能够产生身临其境的感觉。对场景的重建,势必要求真实场景的全方位扫描、3D建模、数据传输、场景内容的材质/光线还原等等多方面的因素齐备。
淘宝即将上市的Buy+就使用虚拟现实技术,宣称能100%还原真实场景,并且能够利用TMC三维动作捕捉技术捕捉动作并触发虚拟环境的反馈。但实际上,现有的技术是完全能够做到静态现实场景的虚拟现实还原的,难点在于,如何实现动态还原。静态的还原撑破天也就是个街景地图而已,能够给予参与者的社交体验还远远不够。而如果希望实现动态画面,又涉及大量的3D建模工作,对于VR硬件的GPU性能也是一种考验。好消息是,最近,针对VR设备,AMD推出新的技术标准,包括120度视角,20ms延迟,以及16k的分辨率!
技术革新的推动力从来都是巨大红利的诱惑,虚拟现实社交的到来是必然,作为流量的最大入口,即便技术难度再高,从业者总不会放弃这片巨量金矿。中国增强现实产业联盟简称AR联盟或ARA对VR化的微信都有些小激动呢