0%

图像分类任务介绍

发表于 2021-09-14 更新于 2022-08-27 分类于计算机视觉阅读次数： Valine：

本文字数： 994 阅读时长 ≈ 1 分钟

什么是图像分类任务，它有哪些应用场合

图像分类任务：图像分类任务是计算机视觉中的核心任务，其目的是根据图像信息中所反映的不同特征，把不同类别的图像区分开来。
应用场合

图像分类：从已知的类别标签中为给定的输入图片选定一个类别标签。
图像识别：知道该物体是什么；
图像搜索：在互联网上搜到该图片的信息(在街上拍个照片去搜索，就知道这个图片在什么位置)
目标检测
图像分割
图像生成

图像分类任务有哪些难点

跨越语义鸿沟，建立像素到语义的映射

视角(不同角度看到同一物体是不一样的)
光照(不同的光照照射到同一物体上反应出来是不一样的)
尺寸(从不同的距离看物体大小是不一样的)
遮挡
形变(比如同一只猫趴着和站着是不一样的)
背景杂波(在背景和物体有相似性，背景对识别进行了干扰)
类内形变(同一类物体具有不同的形状，比如各种各样的凳子)
运动模糊(一个像素记录了多个像素的值)
类别繁多

基于规则的编码方式是否可行

硬编码：把人的理解写成代码，通过硬编码的方法识别物体是一件很困难的事情；

什么是数据驱动的图像分类范式

数据集构建(很多猫、狗等的图片和类别标签)
分类器设计和学习(从数据中学习)
分类器决策

图像表示

像素表示(RGB)
全局特征表示(如：GIST，从图像中抽出频率特征，适用于大场景)
局部特征表示(适应于遮挡，用几个区块特征，即使某个区块被遮挡，也可以用别的区块下结论)

分类器

近邻分类器
贝叶斯分类器
线性分类器
支持向量机分类器
神经网络分类器
随机森林
Adaboost

损失函数

0-1损失
多类支持向量机损失
交叉熵损失
L1损失
L2损失

优化方法

一阶和二阶方法都是迭代优化法。

一阶优化方法
- 随机下降法
- 随机梯度下降
- 小批量随机梯度下降
二阶方法
- 牛顿法
- BFGS
- L-BFGS

训练过程

数据集划分(训练集、测试集和验证集)
数据预处理
数据增强(旋转、裁剪)
过拟合和欠拟合(过拟合：在数据集上表现很好，在实际中效果很差；欠拟合：怎么训练都不行，模型太简单而事情太复杂，怎么训练都搞不定)
- 减少算法复杂度
  - 使用权重正则项
  - 使用droput正则化
超参数调整(超参数：确定的参数，比如神经元层数，个数；参数：训练过程中确定的数)
模型集成(通过运用多个模型，使系统性能更好)

常用的分类任务评价指标是什么

正确率 = 分对的样本数/全部样本数
错误率 = 1 - 正确率
Top1指标与Top5指标

top1：分类结果中第一个正确的才是正确的；
top5:分类结果中前五个有一个正确的才是正确的；