一文搞懂线性表

发布时间：2021-01-30 18:24:46 所属栏目：动态来源：互联网

导读：还有一些过去常用的图像分割技术，但效率不如深度学习技术，因为它们使用严格的算法，需要人工干预和专业知识。这些包括: 阈值 - 将图像分割为前景和背景。指定的阈值将像素分为两个级别之一，以隔离对象。阈值化将灰度图像转换为二值图像或将彩色图像的较亮

还有一些过去常用的图像分割技术，但效率不如深度学习技术，因为它们使用严格的算法，需要人工干预和专业知识。这些包括:

阈值 - 将图像分割为前景和背景。指定的阈值将像素分为两个级别之一，以隔离对象。阈值化将灰度图像转换为二值图像或将彩色图像的较亮和较暗像素进行区分。
K-means聚类 - 算法识别数据中的组，变量K表示组的数量。该算法根据特征相似性将每个数据点(或像素)分配到其中一组。聚类不是分析预定义的组，而是迭代地工作，从而有机地形成组。
基于直方图的图像分割 - 使用直方图根据“灰度”对像素进行分组。简单的图像由一个对象和一个背景组成。背景通常是一个灰度级，是较大的实体。因此，一个较大的峰值代表了直方图中的背景灰度。一个较小的峰值代表这个物体，这是另一个灰色级别。
边缘检测 - 识别亮度的急剧变化或不连续的地方。边缘检测通常包括将不连续点排列成曲线线段或边缘。例如，一块红色和一块蓝色之间的边界。

深度学习如何助力图像分割方法

现代图像分割技术以深度学习技术为动力。下面是几种用于分割的深度学习架构：

使用CNN进行图像分割，是将图像的patch作为输入输入给卷积神经网络，卷积神经网络对像素进行标记。CNN不能一次处理整个图像。它扫描图像，每次看一个由几个像素组成的小“滤镜”，直到它映射出整个图像。

传统的cnn网络具有全连接的层，不能处理不同的输入大小。FCNs使用卷积层来处理不同大小的输入，可以工作得更快。最终的输出层具有较大的感受野，对应于图像的高度和宽度，而通道的数量对应于类的数量。卷积层对每个像素进行分类，以确定图像的上下文，包括目标的位置。

集成学习将两个或两个以上相关分析模型的结果合成为单个。集成学习可以提高预测精度，减少泛化误差。这样就可以对图像进行精确的分类和分割。通过集成学习尝试生成一组弱的基础学习器，对图像的部分进行分类，并组合它们的输出，而不是试图创建一个单一的最优学习者。

DeepLab 使用DeepLab的一个主要动机是在帮助控制信号抽取的同时执行图像分割 —— 减少样本的数量和网络必须处理的数据量。另一个动机是启用多尺度上下文特征学习 —— 从不同尺度的图像中聚合特征。DeepLab使用ImageNet预训练的ResNet进行特征提取。DeepLab使用空洞卷积而不是规则的卷积。每个卷积的不同扩张率使ResNet块能够捕获多尺度的上下文信息。DeepLab由三个部分组成：

Atrous convolutions — 使用一个因子，可以扩展或收缩卷积滤波器的视场。
ResNet — 微软的深度卷积网络(DCNN)。它提供了一个框架，可以在保持性能的同时训练数千个层。ResNet强大的表征能力促进了计算机视觉应用的发展，如物体检测和人脸识别。
Atrous spatial pyramid pooling (ASPP) — 提供多尺度信息。它使用一组具有不同扩展率的复杂函数来捕获大范围的上下文。ASPP还使用全局平均池(GAP)来合并图像级特征并添加全局上下文信息。

SegNet neural network 一种基于深度编码器和解码器的架构，也称为语义像素分割。它包括对输入图像进行低维编码，然后在解码器中利用方向不变性能力恢复图像。然后在解码器端生成一个分割图像。

（编辑：吉安站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

最新报告供应链问题依	密码的完结
消费电子硬件出海没有	电商的流量焦虑有解决