加载中 ...

AR不是人工智能吗?

2019-07-10 16:36:16 来源:沈阳小程序开发 作者:沈阳软件开发

AR/VR通常被称为双胞胎兄弟。它通常被认为是新的应用层技术或“智能可穿戴设备”。与人工智能的“算法”标签相比,它的深度和内涵还不够。它和人工智能之间有什么关系? AR是否属于我们今天所知的人工智能? 2018年3月,上海市经济和信息化委员会在2018年公布了该市第一批人工智能创新项目。共有19家创新企业入围。梁峰台也作为AR公司被列入支持项目。这不是AR公司第一次被归类为人工智能,但这种分类方法并不常见。据了解,这个特别项目是由经济和信息化委员会和市财政局共同开展的,支持金额超过1亿。

简单梳理AR的核心技术

AR(增强现实)是在现实世界中叠加虚拟信息,即“增强”现实。这种增强可以来自视觉,听觉甚至触觉。主要目的是在感官中创造真实世界和虚拟世界。世界融合在一起。

其中,对现实世界的感知主要体现在视觉上,这需要相机的帮助才能获取信息,到图像沈阳APP软件

ad.jpg

并以视频的形式提供反馈。通过视频分析,您可以实现对三维世界环境的感知理解,例如场景的3D结构,内部的物体以及空间的位置。 3D交互式理解的目的是通知系统要“增强”的内容。

这有几个关键点:

首先是对3D环境的理解。要了解您所看到的内容,您主要依赖于对象/场景识别和定位技术。识别主要用于触发AR响应,定位是知道在哪里叠加AR内容。根据精度的不同,定位也可分为粗定位和精定定位。粗略定位是给出一般方向,例如面积和趋势。精确定位可能需要精确到该点,例如3D坐标系中的XYZ坐标和对象的角度。根据应用环境,两个维度的定位在AR中具有应用需求。在AR领域中,常见的检测和识别任务包括面部检测,行人检测,车辆检测,手势识别,生物识别,情感识别和自然场景识别。

在感知逼真的3D世界并与虚拟内容合并之后,有必要以某种方式呈现该虚拟和真实的融合信息。我们需要的是AR中的第二个关键技术:显示技术。目前,大多数AR系统采用透视。头盔显示器,分为视频透视和光学透视,其他代表光场技术(主要称为Magic Leap),全息投影(常出现在科幻电影和电视作品中)。

AR中的第三个关键技术是人机交互,用于与叠加的虚拟信息交互。 AR追求自然的人机交互方法,如语音,手势,手势,脸部等。使用更多的声音和手势。

人工智能和AR技术协会

人工智能领域有几个概念,例如深度学习(DL),机器学习(ML),以及他们自己在包括人工智能(AI)在内的学术领域的研究界限。从某种意义上说,我们常说的是人工智能,它涵盖了“像人一样制造机器”的所有技术的应用方向。

深度学习是实现机器学习的技术方法,而机器学习则是使机器智能化并实现人工智能。可以说人工智能是最终目标,机器学习是实现这一目标的技术方向。其中,还有另一个重要的计算机视觉概念(CV),主要研究如何使机器看起来像个人。它是当前人工智能概念的重要分支。这也是因为人类获得的信息最多。其中一种方式是愿景。目前,计算机视觉已经在商业市场中发挥了作用,如人脸识别;在自动驾驶中阅读交通信号并注意行人;工业机器人用于检测问题控制过程;在三维环境中处理重建图像等等。这些概念具有区别和重叠范围。

其中,自2006年以来,韩丁引发的深度学习热潮开始蔓延,导致人工智能在一定程度上崛起。近十年来,语音识别,计算机视觉和自然语言处理等诸多领域取得了重大成就。应用领域的突破和扩展正在全面展开。

在AR的核心技术,3D环境理解,3D交互理解和计算机视觉,深度学习密切相关。 3D环境理解主要是在学术界的计算机视觉领域,近年来,深度学习已被广泛应用于计算机视觉领域。在交互方面,由于近年来相关领域的深度学习取得了突破,硬件终端中使用了更多自然交互,如手势和语音。也可以说AR中深度学习的应用主要是视觉关键技术。

目前,最常见的AR形式是2D图像扫描识别,如腾讯QQ-AR火炬活动,支付宝五福等多种AR营销,使用手机扫描识别图出现叠加内容,但主要研发方向仍在3D物体识别和3D场景建模中。

逼真的物体以3D形式存在,具有不同的角度和空间取向。因此,自然的扩展是从2D图像识别到3D物体识别,识别物体的类别和姿势,并且可以在这里使用深度学习。以果实识别为例,识别出不同类型的果实,并给出定位区域,即综合物体识别与检测功能。

3D场景建模,从识别3D对象扩展到更大和更复杂的3D区域。例如,识别场景中的内容,空间位置和关系等。这是3D场景建模,这是AR比较技术的核心。这涉及当前流行的SLAM(实时位置和地图构建)。扫描场景,然后在其上叠加三维虚拟内容,如虚拟战场。如果您只需要基于正常的2D图像识别识别正常图像,则在图像不可见时它将失败。在SLAM技术中,即使不存在特定的平面,由于周围3D环境的帮助,空间定位仍然非常准确。

在这里,我们希望探索深度学习和SLAM技术的融合。计算机视觉可以分为两种类型,一种基于学习的方法,如特征提取 - 特征分析 - 分类。目前,深度学习技术已经占据了这条路线。性地位。另一种途径是基于几何视觉,从线,边,3D形状到物体的空间结构信息,代表性技术是SFM/SLAM。深度学习基本上是在学习方向上占主导地位,但在几何视觉领域,仍然没有相关的进展。从学术界来看,深度学习技术的研究进展可以说日新月异,最近十年SLAM技术的进步相对较小。在国际视觉顶级会议ICCV 2015组织的SLAM技术研讨会上,基于近年来其他视野中深度学习的快速发展,一些专家提出了在SLAM中使用深度学习的可能性,但仍然没有成熟的思考。总的来说,短期内深度学习和SLAM的结合是值得研究的方向。从长远来看,结合语义和几何信息是一个非常有价值的趋势。因此,SLAM + DL值得期待。

在交互方面,主要包括语音识别和手势识别。语音识别目前取得了很大进展。百度,科达迅飞,云之声等国内公司名列前茅。 AR公司希望突破。这是手势识别的成熟商业化。

“梁峰台所展示的基于深度识别的手势识别系统主要定义了上,下,左,右,顺时针和逆时针六种姿势。”梁凤泰的工作人员告诉青鼎网,实现人手的检测和定位。然后通过识别相应的手势轨迹来实现对人类手势的识别。虽然其他人工智能的流行领域如人脸识别也被用于AR,但它并不是AR的重要研究和发展方向。

不难看出AR的基础技术或基本部分是计算机视觉与相关领域的融合,而流行的深度学习与AR的结合也是算法工程师的方向。这也是计算机视觉与人机交互的交集。 AR的基础是人工智能和计算机视觉的基础。

在去年发布的《人工智能影响力报告》中,还简要计算了人工智能科学家的统计数据,包括面部识别,语音识别,机器人,AR和芯片等公司中高端研发人员的分布情况。它还说明了AI领域的细分方向。 AR真的是人工智能吗?

对于AR从业者而言,理想的状态是用更智能的AR终端取代智能手机。因此,对于用户而言,与AR的第一次联系是内容,其次是终端,并且AR产业链可以大致分为技术产品。商业,智能终端开发公司和AR内容提供商。其中,AR设备提供商不可避免地关注硬件技术,如底层芯片,电池,光学镜头等,以及硬件本身的性能优化,内容提供商更倾向于优化内容和性能关于现有技术。因此,我们可以说AR技术提供商,或者在底层算法中具有一定水平研发水平的AR公司,都是人工智能公司。

对于公司而言,特别是初创公司将把底层技术转变为成熟的产品或服务,可能像无人机,AR智能终端,机器人等,或用于商业目的的行业解决方案,这已成为人工智能的期望和需求公司受到媒体,企业和公众的嗡嗡声后。最近,人工智能产业发展联盟(AIIA)出版的书籍《人工智能浪潮:科技改变生活的100个前沿AI应用》将向公众发布,并将包括目前巨头企业和企业在商业化方面的领先成就,并直接反映当前AI的商业化方向。

作为技术驱动的业务领域,无论是AR还是人工智能的其他方面,在技术距离完全成熟之前还有很长的路要走。随着整个产业链逐渐繁荣并专注于商业化,还有更多工作要做。公司的机构不断扩大技术界限,建立核心竞争力,让行业脱离更大的价值和潜力。因此,可以预期中国角落之路超车的AI时代。

汇海 Technology是领先的综合性软件和信息服务公司,为客户提供从软件开发到营销和推广的互联网解决方案,旨在成为业界领先的全链信息技术服务提供商。公司与中国移动,平安银行,南方数字,北大青鸟,西门子等行业巨头进行了全面深入的战略合作。深入涉足汽车,金融,电子商务,农业,教育等重点行业,不断开拓全国市场,为客户提供全方位的连锁服务。优质,高效,技术服务,综合优势和行业特色。武汉哪家公司做网站?武汉哪家公司做网站?哪家公司是网站?武汉着名的网站建设公司?武汉的武汉网站生产企业有哪些?武汉网站外包?武汉有哪些可靠的软件开发公司?武汉有哪些更好的app开发,微信开发和系统开发公司?如果您有这样的需求,请联系汇海技术,财富热线:027-86633307,我们将以专业的服务态度做到每一个需要,这是我们的目标,使每一个需要到极致!

“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。