图像分类任务介绍
什么是图像分类任务,它有哪些应用场合
图像分类任务:图像分类任务是计算机视觉中的核心任务,其目的是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。
应用场合
- 图像分类:从已知的类别标签中为给定的输入图片选定一个类别标签。
- 图像识别:知道该物体是什么;
- 图像搜索:在互联网上搜到该图片的信息(在街上拍个照片去搜索,就知道这个图片在什么位置)
- 目标检测
- 图像分割
- 图像生成
图像分类任务有哪些难点
跨越语义鸿沟,建立像素到语义的映射
- 视角(不同角度看到同一物体是不一样的)
- 光照(不同的光照照射到同一物体上反应出来是不一样的)
- 尺寸(从不同的距离看物体大小是不一样的)
- 遮挡
- 形变(比如同一只猫趴着和站着是不一样的)
- 背景杂波(在背景和物体有相似性,背景对识别进行了干扰)
- 类内形变(同一类物体具有不同的形状,比如各种各样的凳子)
- 运动模糊(一个像素记录了多个像素的值)
- 类别繁多
基于规则的编码方式是否可行
硬编码:把人的理解写成代码,通过硬编码的方法识别物体是一件很困难的事情;
什么是数据驱动的图像分类范式
- 数据集构建(很多猫、狗等的图片和类别标签)
- 分类器设计和学习(从数据中学习)
- 分类器决策
图像表示
- 像素表示(RGB)
- 全局特征表示(如:GIST,从图像中抽出频率特征,适用于大场景)
- 局部特征表示(适应于遮挡,用几个区块特征,即使某个区块被遮挡,也可以用别的区块下结论)
分类器
- 近邻分类器
- 贝叶斯分类器
- 线性分类器
- 支持向量机分类器
- 神经网络分类器
- 随机森林
- Adaboost
损失函数
- 0-1损失
- 多类支持向量机损失
- 交叉熵损失
- L1损失
- L2损失
优化方法
一阶和二阶方法都是迭代优化法。
- 一阶优化方法
- 随机下降法
- 随机梯度下降
- 小批量随机梯度下降
- 二阶方法
- 牛顿法
- BFGS
- L-BFGS
训练过程
- 数据集划分(训练集、测试集和验证集)
- 数据预处理
- 数据增强(旋转、裁剪)
- 过拟合和欠拟合(过拟合:在数据集上表现很好,在实际中效果很差;欠拟合:怎么训练都不行,模型太简单而事情太复杂,怎么训练都搞不定)
- 减少算法复杂度
- 使用权重正则项
- 使用droput正则化
- 减少算法复杂度
- 超参数调整(超参数:确定的参数,比如神经元层数,个数;参数:训练过程中确定的数)
- 模型集成(通过运用多个模型,使系统性能更好)
常用的分类任务评价指标是什么
正确率 = 分对的样本数/全部样本数
错误率 = 1 - 正确率
Top1指标与Top5指标
- top1:分类结果中第一个正确的才是正确的;
- top5:分类结果中前五个有一个正确的才是正确的;