知识—如何进行图像数据的归一化呢(normalize)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 范围归一化
  • 均值和标准差归一化
  • &引申
  • 总结

前言

在做基于图像的目标检测遇到了图像的归一化操作,为此展开了一定的探讨:

图像归一化是指对图像进行了一系列标准的处理变换,使之变换为一固定标准形式的过程,该标准图像称作归一化图像。


范围归一化

将图像的像素值缩放到一个特定的范围,通常是 [0, 1] 或 [-1, 1]。

这有助于确保所有像素值都在一个有限的范围内,适用于很多深度学习模型。

公式:

normalized_pixel_value = (original_pixel_value - min_pixel_value) / (max_pixel_value - min_pixel_value)

其中,min_pixel_value 和 max_pixel_value 是图像中像素值的最小和最大值。

均值和标准差归一化

将图像的每个通道的像素值减去通道的均值,然后除以通道的标准差。

这有助于消除不同通道之间的偏移和缩放差异。

公式:

normalized_pixel_value = (original_pixel_value - mean) / std

其中,mean 和 std 是对应通道的均值和标准差。

&引申

归一化和标准化的区别:

归一化的缩放是“拍扁”统一到区间(仅由极值决定),而标准化的缩放是更加“弹性”和“动态”的,和整体样本的分布有很大的关系。

值得注意:
归一化:缩放仅仅跟最大、最小值的差别有关。

标准化:缩放和每个点都有关系,通过方差(variance)体现出来。与归一化对比,标准化中所有数据点都有贡献(通过均值和标准差造成影响)。

为什么要标准化和归一化?

提升模型精度:归一化后,不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性。
加速模型收敛:标准化后,最优解的寻优过程明显会变得平缓,更容易正确的收敛到最优解。


总结

这些归一化方法可以提高模型训练的稳定性和收敛速度,同时有助于防止模型对输入数据的敏感性过大。

选择合适的归一化方法通常取决于模型的架构和训练数据的特性。

在使用深度学习框架时,通常会提供一些内置的归一化层或转换函数,简化了这个过程。