图像分类任务介绍

什么是图像分类任务,它有哪些应用场合

图像分类任务:图像分类任务是计算机视觉中的核心任务,其目的是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。
应用场合

  • 图像分类:从已知的类别标签中为给定的输入图片选定一个类别标签。
  • 图像识别:知道该物体是什么;
  • 图像搜索:在互联网上搜到该图片的信息(在街上拍个照片去搜索,就知道这个图片在什么位置)
  • 目标检测
  • 图像分割
  • 图像生成

图像分类任务有哪些难点

跨越语义鸿沟,建立像素到语义的映射

  • 视角(不同角度看到同一物体是不一样的)
  • 光照(不同的光照照射到同一物体上反应出来是不一样的)
  • 尺寸(从不同的距离看物体大小是不一样的)
  • 遮挡
  • 形变(比如同一只猫趴着和站着是不一样的)
  • 背景杂波(在背景和物体有相似性,背景对识别进行了干扰)
  • 类内形变(同一类物体具有不同的形状,比如各种各样的凳子)
  • 运动模糊(一个像素记录了多个像素的值)
  • 类别繁多

基于规则的编码方式是否可行

硬编码:把人的理解写成代码,通过硬编码的方法识别物体是一件很困难的事情;

什么是数据驱动的图像分类范式

  • 数据集构建(很多猫、狗等的图片和类别标签)
  • 分类器设计和学习(从数据中学习)
  • 分类器决策

图像表示

  • 像素表示(RGB)
  • 全局特征表示(如:GIST,从图像中抽出频率特征,适用于大场景)
  • 局部特征表示(适应于遮挡,用几个区块特征,即使某个区块被遮挡,也可以用别的区块下结论)

分类器

  • 近邻分类器
  • 贝叶斯分类器
  • 线性分类器
  • 支持向量机分类器
  • 神经网络分类器
  • 随机森林
  • Adaboost

损失函数

  • 0-1损失
  • 多类支持向量机损失
  • 交叉熵损失
  • L1损失
  • L2损失

优化方法

一阶和二阶方法都是迭代优化法。

  • 一阶优化方法
    • 随机下降法
    • 随机梯度下降
    • 小批量随机梯度下降
  • 二阶方法
    • 牛顿法
    • BFGS
    • L-BFGS

训练过程

  • 数据集划分(训练集、测试集和验证集)
  • 数据预处理
  • 数据增强(旋转、裁剪)
  • 过拟合和欠拟合(过拟合:在数据集上表现很好,在实际中效果很差;欠拟合:怎么训练都不行,模型太简单而事情太复杂,怎么训练都搞不定)
    • 减少算法复杂度
      • 使用权重正则项
      • 使用droput正则化
  • 超参数调整(超参数:确定的参数,比如神经元层数,个数;参数:训练过程中确定的数)
  • 模型集成(通过运用多个模型,使系统性能更好)

常用的分类任务评价指标是什么

正确率 = 分对的样本数/全部样本数
错误率 = 1 - 正确率
Top1指标与Top5指标

  • top1:分类结果中第一个正确的才是正确的;
  • top5:分类结果中前五个有一个正确的才是正确的;