让我们从第一张图片开始。如果我问你图片中有什么?你的答案将是,它是一只猫。这其实是对图片进行了分类。这意味着基于图像的分类标记图像。这里的类别是“猫”。
现在你知道图像的类别了。下一个问题是对象在图像中的位置。当我们确定对象在框架中的位置并在其周围创建一个边界框时,这称为定位。在第二张图像中,我们已经确定了对象的位置并将其标记为猫。
下一项是对象检测。在前两种情况下,图像中只有一个对象,但是如果存在多个对象该怎么办。在这里,我们通过边界框确定存在的实例及其位置。
在对象检测中,我们使用形状为正方形或矩形的边界框,但是它不能告诉任何有关对象形状的信息。实例分割会在每个对象周围创建一个像素级蒙版。因此,实例分割使人们对图像有了更深入的了解。
近期发展
深度学习方法的最新发展和技术的进步极大地提高了视觉识别系统的功能。结果,计算机视觉已被公司迅速采用。可以在整个工业领域看到成功的计算机视觉用例,从而扩大了应用范围,并增加了对计算机视觉工具的需求。
现在,让我们一起来看看计算机视觉的5个令人兴奋的应用程序。
使用计算机视觉进行姿态估计
姿态估计是计算机视觉的一个很有趣的应用。你一定已经听说过Posenet,它是用于人体姿态估计的开源模型。简而言之,姿态估计是一种计算机视觉技术,可以推断图像/视频中存在的人或物体的姿势。
在讨论姿态估计的工作之前,让我们首先了解“人体姿势骨架”。它是定义一个人的姿势的一组坐标。一对坐标称为肢体。此外,通过识别,定位和跟踪图像或视频中人类姿势骨架的关键点来执行姿态估计。
我选择人脸检测作为本文的开头,因为我们都已经看到这是计算机视觉的一种应用。但是计算机视觉不仅限于此。在本文中,你将探索计算机视觉的更多有趣应用。
目录
-
什么是计算机视觉?
-
使用计算机视觉进行姿态估计
-
使用Gans进行图像转换
-
开发社交距离工具的计算机视觉
-
将2D图像转换为3D模型
-
医学图像分析
什么是计算机视觉?
在进入计算机视觉应用程序世界之前,首先,让我们了解一下计算机视觉是什么?简而言之,计算机视觉是人工智能的一个多学科分支,旨在复制人类视觉的强大功能。
如果是正式定义,
“计算机视觉是一种实用工具,可以根据感知到的图像对实际的物理对象和场景做出有用的决策”(Sockman&Shapiro,2001)
计算机视觉通过诸如图像分类,对象检测,图像分割,对象跟踪,光学字符识别,图像字幕等视觉识别技术来工作。我知道这些是很多技术术语,但理解它们并不难。只需看下面的图片,你就会了解许多这些术语。

(编辑:吉安站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|