元宇宙怎么登陆进入 详解入口和使用方法?

元宇宙入口之争,或许还需要经受时间的考验。电影《头号玩家》为人们构建了无与伦比的元宇宙体验场景,令每一个玩家心生向往。尽管2045年距离现在还有20多年,但当电影主角韦德戴上VR头显把我们带进虚拟世界的那一刻,元宇宙仿佛就在眼前。扎克伯格曾提出元宇宙八大要素,其中“身临其境感”排在首位,可是直到今天,还没有一款头显设备可以达到“元宇宙”所定义的标准。在理想的元宇宙中,人们可以以更切实的方式复制现实世界的各个方面,包括社交、娱乐、电子商务等等。换句话说,未来人们可以在社会和经济上进行互动——无论他们所处的位置距离有多远。随着AR和VR的发展以及5G连续性的增强,有了增强现实(AR)、虚拟现实(VR)和混合现实(MR),可将虚拟世界准确地投射到物理世界中。其中,AR可以将数字信息覆盖并叠加到物理环境,VR则能让人感受栩栩如生的数字世界。各大传统互联网企业纷纷入局元宇宙,国内外游戏公司与资本的蜂拥而至,共同促成“元宇宙”市场的大爆炸。通常而言,体验沉浸式元宇宙内容的前提之一就是开发全息技术。如今已经有很多主打全息概念的方案,例如:Light Field Lab就号称要打造类似《星际迷航》的“全息甲板”,RED此前开发的Hydrogen One全息手机、Voxon全息投影、Leia的Lume Pad全息平板电脑等。今天我们要说的就是一款AR全息显示器。没错,你可能见过很多种类的显示器,例如手机屏幕、平板电脑、甚至电脑显示器等等,而全息显示器的概念鲜有耳闻。美国科技公司Brelyon正为人们提供无需头显的显示解决方案,基于沉浸式的全景虚拟屏幕,用户将能看到视场角达到101度的虚拟全景图像,也因此不少人将它比作通往元宇宙的“超级公路”。那么,Brelyon如何做到无需VR/AR头显体验元宇宙?又将如何颠覆人们进入元宇宙的方式?Brelyon是一家主打全息显示器的创业公司,创始人Barmak Heshmat博士出身麻省理工学院媒体实验室,在光学、物理学拥有丰富的经验,最大的技术成就是解决了单眼深度显示的难题。Brelyon联合创始人、前MagicLeap高级光学工程师Reza Khorasaninejad博士曾担任哈佛博士后研究员,他从2014年起就开始研究轻量化AR眼镜技术,并将其取名为Metasurface,还在Ted演讲中分享了这种薄如发丝的微型透镜的相关研究。Brelyon公司从成立后一直对外保密,经过几年的蛰伏,终于有了大动作,准备一展宏图。今年1月,Brelyon在拉斯维加斯的CES上首次展示了其技术,其研发的Ultra Reality拥有光场技术专利,使用精确的波前(wavefront)工程来创造拥有超大视场角和真实光学深度的图层,生成沉浸式的虚拟全景显示器,无需使用头显也能让观众环绕在虚拟屏幕中。9月20日,Brelyon宣布完成1500万美元A轮融资。本轮融资由洛克希德·马丁风险投资公司和MIT附属E14基金领投,康宁、LG Technology Ventures、UDC Ventures(Universal Display Corporation 的企业风险投资部门)和Franklin Templeton参投。目前,Brelyon已经将20多家企业纳入了其早期访问(Early Access)计划,这笔融资将帮助Brelyon发展这些试点项目,并在企业市场站稳脚跟。近期Brelyon与军事和航空航天应用坚固耐用计算解决方案提供商ZMicro宣布达成战略合作伙伴关系。两家公司将共同开发Brelyon的Ultra Reality坚固耐用显示器,用于部署军事市场,ZMicro将成为Brelyon技术在崎岖市场的独家供应商。Brelyon获得专利的Ultra Reality技术以更紧凑的外形尺寸呈现了一个巨大的虚拟屏幕,使其成为空间受限应用的理想解决方案,包括下一代地面战车和远程或分布式节点指挥和控制中心。创始人Heshmat博士表示,“短期内,我们将专注于产品量产和配套软件的开发,具体而言,我对于虚拟显示器更基本构架的扩展感到兴奋,这将能够帮助我们厘清量产所需的条件并提高单位经济效益。”“无论是眼对眼的沉浸式视频会议,还是分辨率和视场角相当于6台32英寸显示器的屏幕,又或是AI辅助内容生成,再到用于增强知识工作者能力的串联视觉计算机,基于我们的Ultra Reality,我看到了一个完全沉浸却不与现实隔离的世界”,Heshmat进一步补充道。2022年2月23日,Brelyon开创了一种新的超沉浸式显示技术,其Ultra Reality显示技术被评为2022年棱镜将显示器的赢家。该奖项是由国际光学与光子学学会SPIE和Photonics Media颁发的,旨在表彰市场上的顶级光学和光子学产品以及最具创新性的光子学技术。Ultra Reality将新颖物理和计算机光学领域的最新技术与超圆锥广场扩展技术相结合,提供了一个120英寸以上的大型曲面显示器,可提供具有数米真实光学深度的全景影院级虚拟图像。这意味着,用户将能看到视场角达到101度的虚拟全景图像。根据麻省理工学院媒体实验室的Ramesh Raskar教授所解释的,传统上的光场是通过对角度场进行二次采样来表示的,这种方法的弊端就是它通常伴随着角度雾度伪影和每个视角的分辨率降低,最终导致图像质量较差,而Brelyon使用其单目深度调制功能为用户提供减轻眼睛疲劳和图像伪影的视觉体验。此外,当前大多数3D显示器使用笨重的立体耳机或眼镜来模拟深度,以让用户的眼睛相信他们看到的是3D图像。而Ultra Reality的光学技术解决了单眼深度的问题,为用户创建了一个巨大的视场,不需要耳机就能让观看者获得置身其中的沉浸感。并且他们还将上述的全景图像融合在一个很小的桌面空间中,Brelyon创始人兼首席执行官Barmak Heshmat博士在媒体上说,“Brelyon开创了全息甲板式沉浸式2D和3D显示器的新时代,将取代传统的桌面显示器。”Brelyon不仅在技术上颠覆了过去传统计算机所做的事,还将游戏、电子竞技、虚拟世界体验等带到桌面。该公司目前正在与战略合作伙伴建立试点合作伙伴关系,其中包括世界500强和跨国企业,涉及游戏、金融、生产力和工业应用等一系列行业。比如,Brelyon与Monozukuri以及一些日本实体建立合作伙伴关系,这将成为以视觉艺术吸引世界的富有想象力文化的一个很好的入口,试图填补虚拟世界中的沉浸式空白。Formant与Brelyon的合作为机器人操作员带来了身临其境的展示,经过优化的Brelyon显示器,可在远程操作期间与Formant一起使用,为机器人操作员提供110度视角,缓解眼睛疲劳,延长与数字内容的交互时间。除此之外,Brelyon还与显示行业P-OLED技术的全球领导者LG Display整合,通过将P-OLED技术集成到Brelyon超沉浸式虚拟显示器,打造出卓越的视觉体验,并开辟沉浸式体验的新市场和类别。他们的合作将为正在崛起的大型游戏和生产力部门提供一种解决方案,远超当前显示器领域所见的任何解决方案。尽管市场以及消费者对于硬件的采用需要一些时间,但毫无疑问的是,Brelyon的出现开启了用户进入元宇宙的另一个窗口。正如其创始人的表述,“未来的人机体验需要更好的沉浸感和智能技术。而我们建立这家公司的逻辑非常简单:如果我们能够让你无需将屏幕戴在脸上就能够获得其一半的沉浸感,同时还能够兼容所有现有内容,将极大的提升现有计算机的体验,帮助人们更好地迈向新兴的元宇宙。”元宇宙在热闹一年多以后,陆陆续续迎来了一些落地性的产品,不管是硬件方面的进步,还是软件方面场景化的搭建,又或者各种虚拟人的铺天盖地,一切似乎都从0到1有了雏形。这其中关于元宇宙入口的话题依然不绝于耳,正如我们在文章开头的描述,绝大部分从业者都会把VR/AR或者MR作为元宇宙的入口来看待,而这种看待会沿着移动智能手机的发展而延伸下去——先要有硬件的迭代,才能有软件的普及。可事实真的如此吗?或许对于元宇宙的发展来说,通过观察过去一些行业的发展,来“瞎子摸象”般建设新兴行业也不失一种选择,毕竟历史很难重复,但免不了押韵。而Brelyon的出现为我们打开了新的思路,毕竟不是所有人都能接受戴着一个头盔或者AR眼镜的事实,甚至对于一些不便于操作的用户来说,当前的VR设备依然保持着高门槛,鲜有像Brelyon这样的产品能更加让人直观感受到元宇宙的魅力。当然,我们暂不知道元宇宙的终极入口究竟在哪,以及哪家公司能跑出来,毕竟关于入口的说法只有等到真正实现后才更具备讨论价值,而一开始的锚定都是为了市场发展。就如Facebook的发展一样,2012年上市后如果没有转型移动端的战略布局,可能现在的Facebook早就没落了,何来“All in Meta”。所以,当我们去看Brelyon这家企业时,才会发现为什么一家还没卖出去多少产品的公司还能获得业界知名机构的青睐,而这背后反映出的是对元宇宙入口的下注和笃定。正如,Meta(Facebook更名)的首席财务官David Wehner在年初财报发布后的发言,“广告主已经不再向我们询问是否应该在移动端投放广告,而是问如何在移动端投放广告”。在历史的大潮面前,能踩准浪花的公司寥寥无几,至于元宇宙入口之争,或许还需要经受时间的考验。Brelyon作为VR/AR之外的特殊存在,在未来一段时间依然具备着较强竞争力和想象力,我们也乐意看到更多这样具备颠覆性的产品出现,毕竟千篇一律的故事也显淡漠。至于Brelyon最后会不会成为元宇宙入口,或许只有市场会告诉我们答案。【声明】:本文为元宇宙之心运营团队原创,未经允许严禁转载,如需转载请联系我们,文章版权和最终解释权归元宇宙之心所有。
2022 年 2 月 4 日,冬奥会正式开幕。在开幕式及冬奥会赛事进程中,人工智能、5G、AR、裸眼 3D 和云等多种硬科技大显神通。其中,作为元宇宙场景入口和连接纽带的虚拟数字人技术尤为引人注目。本次冬奥会的手语主播和气象主播均为虚拟数字人。本文将带领大家由冬奥 AI 主播走进虚拟数字人,详细了解其内涵、技术实现、发展现状以及颇具前景的应用领域。1. 什么是虚拟数字人:高度拟人、自然互动拟数字人最早可追溯到 20 世纪 80 年代。1982 年,日本动画《超时空要塞》播出后,制作方将女主角林明美包装成演唱动画插曲的歌手,并制作了音乐专辑,世界上第一位虚拟歌姬由此诞生。此时的虚拟数字人以手绘为主。21 世纪初,计算机图形学(CG, Computer Graphics) 和动作捕捉技术逐渐成熟,在虚拟数字人的制作中得到广泛应用,如“初音未来”,其早期形象便是利用 CG 技术合成。近 5 年来,得益于人工智能技术的飞速发展和应用,虚拟数字人制作更加便捷、精准和智能。在 AI 技术加持下,虚拟数字人形象可达到写实级逼真程度,且具备情感表达和沟通交流的智能交互能力。目前市场中探讨的虚拟数字人主要为 AI 加持下高仿真、可互动的虚拟数字人,虚拟化、数字化和拟人化是其核心要素。 虚拟化:存在于非物理世界中,目前主要以图片、视频、实时直播、实时动画等方式存在于 APP、小程序、软硬一体显示设备等中;未来,VR 设备与全息投影也将成为其重要存在方式。
数字化:依赖多项数字化技术,包括 CG(Computer Graphics,利用计算机进行视觉设计和生产)、语音识别、图像识别、动作捕捉等相关技术。
拟人化:虚拟人在外表、行为以及思想与交互方面,均与人高度相似。
外表:具有特定的相貌、性别和性格等人物特征。虚拟数字人的外表会受到虚拟数字人类别(如直接借用真人形象、高保真建模、风格化)、制作细节(对汗毛、皮肤、头发等细节的建模)、渲染水平、设计审美等影响。
行为:具有用语言、面部表情和肢体动作表达的能力。虚拟数字人的行为表现会受到驱动方式(真人驱动、智能驱动等)、训练数据、驱动模型精度等影响。
互动:具有识别外界环境、并能与人交流互动的能力。虚拟数字人的交互能力会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识库等的影响。 2. 技术实现:多模态 AI 和算力为核心支撑虚拟数字人主要由三大核心技术环节作为支撑:建模(即虚拟数字人形象的生成),驱动(即识别用户的意图,并根据用户当前意图决定数字人后续的语音和动作,驱动虚拟数字人与用户开启下一轮交互)和渲染(让虚拟数字人的皮肤纹理等变得真实,形象更加拟人)。这些技术环节均离不开人工智能技术的加持和算力资源的支持。2.1 建模:计算机视觉技术加持目前的建模主要仍依靠 CG(Computer Graphics,计算机图形学)和静态扫描技术。但其成本高昂,环球影业运用 CG 技术还原已去世的保罗在《速度与激情 7》中的表演,相关渲染成本增加了约 5000 万美元。此外,CG 技术合成的虚拟人也面临形象粗糙、仿真度不足的挑战。近年来,随着人工智能技术的发展,利用深度学习的动态三维重建技术逐渐显露锋芒。动态三维重建技术主要采用摄像机阵列采集几何形态、纹理、材质、三维运动信息等动态数据,同时结合光场中所有光线的方向和角度数据,为建模提供丰富、精细的信息,提升建模的效果。同时,AI 技术也大大降低了建模的门槛。拟人的表情动作,如简单的皱眉,也会牵动骨骼、肌肉、皮肤的一系列变化。用传统的手工方式去调整工作量巨大,而利用 AI 技术可大幅降低工作量。2.2 驱动:多模态 AI 技术赋能根据互动驱动方式的差异,虚拟数字人可分为真人驱动型和 AI 驱动型两大类。真人驱动型虚拟数字人由真人的动作表达配合动作捕捉技术,驱动虚拟人与观众进行实时交互。AI 驱动型虚拟数字人则通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策虚拟数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。图 1 虚拟数字人的分类-技术角度真人驱动型虚拟数字人的核心技术支撑为动作捕捉技术。主流的动作捕捉技术为光学捕捉和惯性捕捉,但设备较为昂贵。今年来,随着深度学习技术和表情、动作识别等算法的进步,基于计算机视觉的动作捕捉逐渐兴起,具有低价、简单、易用的优势,普通的摄像头结合优质的识别算法也能实现良好的驱动。AI 驱动的虚拟数字人则需依赖多模态人工智能技术,综合运用视觉、听觉等多种“感官”,让 AI 形象更加拟人。具体技术主要包括: 语音识别(ASR):听觉感知,实现“听得见”
自然语言处理(NLP):准确理解用户的需求,即“听得懂”
语音合成 (TTS):回应与互动,且语言表达符合真人发声习惯
语音驱动面部动画(ADFA):通过语音驱动虚拟数字人唇形的变化 相比于单一模态的算法开发,多模态模型的开发训练更加复杂,涉及多模态表征学习、模态转换、对齐、多模态融合和协同学习等复杂技术细节和大规模训练需求。因此,高易用性的开发生产工具和高性能的计算引擎,对于提升虚拟数字人开发生产效率,降低训练成本同样至关重要。2.3 渲染:大规模算力支撑渲染技术用于提升虚拟人的逼真程度,可分为实时渲染和离线渲染,对于精细度要求较高、时效性要求低的场景则可采用离线渲染,游戏和实时交互场景则需要实时渲染。由于算力资源和传输速度的限制,实时渲染在画质和效果的表现仍有较大提升空间。虚拟数字人渲染需消耗大量算力资源,对企业来说是一项巨额成本支出,极大限制了虚拟数字人的探索与应用。目前绝大多数企业算力的管理仍相对粗放,算力资源的高效利用和精细化管理有望有效降低虚拟数字人开发制作成本,促进其应用落地。综上,从虚拟数字人制作全生命周期技术需求来看,多模态 AI 技术和充足的算力支撑是核心,而易用、高性能的 AI 开发生产工具和高效的算力资源管理则是促进其落地应用的基础保障。白海科技新一代 AI 开发生产平台-IDP,提供兼具交互式编程和工程化功能的易用 IDE、高性能分布式计算引擎和精细化的资源调度管理(包括资源隔离、任务级别的断点续跑、自动休眠等),可有效加速虚拟数字人的开发,降低算力资源消耗。3. 技术应用现状与趋势:游戏领域或大有可为目前虚拟数字人已在金融客服、媒体主播、游戏角色等领域得到应用。在去中心化的 Web 3.0 和元宇宙趋势下,我们认为个人或社区运营的数字化身类虚拟人商业化前景广阔,游戏赛道或是其首当其冲的爆发领域。图 2 虚拟数字人的应用分类近期:RPG 游戏精品化的需求随着监管趋紧和游戏玩家数量趋于饱和,我国游戏行业目前已进入存量博弈阶段。在激烈的竞争环境下,为用户提供更加丰富和沉浸式的体验成为关键成功要素。近期典型的案例就是 ARPG 游戏《原神》,凭借品质和口碑,吸引了大量流量。丰富精美的虚拟化身是《原神》最重要的组成成分之一。截止版本 2.2,《原神》可玩角色数量已达 41 个。制作团队预计每年为《原神》新增大约 17 个角色,这对开放世界 ARPG 来说并非一个小数目。从游戏类别来看,与虚拟数字人高度相关的角色类游戏(包括角色扮演类游戏和多人竞技类游戏)在我国游戏营收贡献居于首位,在移动游戏中营收占比~35%。该类游戏的精品化,将利好虚拟数字人技术的应用落地。虚拟数字人技术能够有效简化和加快游戏动画制作过程,让游戏中更多的虚拟角色都具备丰富的肢体动作和精细的面部表情,给玩家带来更沉浸的游戏体验。图 3 中国游戏市场趋势中远期:元宇宙游戏对数字身份的需求游戏作为现实的模拟和延伸,形态与元宇宙十分相似,有可能成为元宇宙最先应用的场景。微软首席执行官萨蒂亚·纳德拉在微软收购动视暴雪后表示:“在如今的所有平台上,游戏是最具活力、最让人兴奋的娱乐类别,未来将会在元宇宙平台的发展中发挥关键作用。”从技术角度讲,元宇宙游戏的核心是去中心化,开放社交与自主创造,用户可以使用多平台互通、安全、自治的数字身份,与其玩家进行互动。开放的元宇宙游戏世界将提升对虚拟数字人的需求。例如,在目前公认最接近元宇宙游戏的 Roblox 中,每个人都可以自定义数字身份来与他人进行社交,包括查看附近玩家、线上派对和会议、虚拟音乐会等。目前虚拟数字人市场仍处于前期培育阶段,但市场对其关注度已持续上升,将会有越来越多的企业投入虚拟数字人产业链。游戏企业在虚拟数字人需求和落地场景层面具有得天独厚的优势,在技术的有力加持下,有望基于数字身份重塑游戏理念。4. IDP 助力游戏企业加速 AI 应用与创新游戏的设计、制作、用户运营等全生命周期与人工智能各子技术都有交叉,是人工智能技术应用落地,实现社交智能(Social Intelligence)、 情感交互(Affective Interaction)和通用智能(General Intelligence)等目标的理想场景。除降低虚拟数字人开发应用门槛外,IDP 在对于游戏企业智能用户分析、游戏智能生产设计与优化方面也同样具有降本增效、加速迭代的作用。在游戏企业广泛拥抱 AI 技术的过程中,IDP 将同企业一起,高效率、低成本地实现 AI 的创新应用,促进游戏企业的智能化颠覆式创新。图 4 IDP 加速游戏企业 AI 创新—用户洞察与运营分析图 5 IDP 加速游戏企业 AI 创新—游戏生产设计【参考资料】德勤咨询,元宇宙系列白皮书—未来已来,2021.12国盛证券,虚拟人的“灵魂”是什么?2021.12中国人工智能产业发展联盟,虚拟数字人发展白皮书,2020申港证券,微软收购动视暴雪 元宇宙生态布局再下一城,2022.01

我要回帖

更多关于 度宇宙 的文章

 

随机推荐