# 创建图像分类模型数据集

在训练之前需要在数据服务【创建数据集】,添加并标注数据

# 设计分类

首先想好分类如何设计,每个分类为你希望识别出的一种结果。比如物件"正面"、"反面",产品是否合格"ok"、"ng"。 用户可以在【标签组管理】提前设置好常用的分类,在数据标注时可以直接引用,省去重复创建分类的工作。

# 准备数据

基于设计好的分类准备图片:

  • 每个分类需要准备 20 张以上
  • 如果想要较好的效果,建议每个分类准备不少于 100 张图片
  • 如果不同分类的图片具有相似性,需要增加更多图片,尽量提升图片数据的丰富度
  • 一个模型的图片总量不能超过用户剩余图片容量(在【费用中心】查看)

图片格式要求:

  • 1、目前支持图片类型为 png、jpg、bmp、jpeg,图片大小限制在 14M 以内

  • 2、图片长宽比在 3:1 以内,其中最长边小于 4096px,最短边大于 30px

图片内容要求:

  • 1、训练图片和实际场景要识别的图片拍摄环境一致,举例:如果实际要识别的图片是摄像头俯拍的,那训练图片就不能用网上下载的目标正面图片

  • 2、每个分类的图片需要覆盖实际场景里面的可能性,如拍照角度、光线明暗的变化,训练集覆盖的场景越多,模型的泛化能力越强

如果训练图片场景无法全部覆盖实际场景要识别的图片:

如果要识别的主体在图片中占比较大,模型本身的泛化能力可以保证模型的效果不受很大影响 如果识别的主体在图片中占比较小,且实际环境很复杂无法覆盖全部的场景,建议用目标检测的模型来解决问题(物体检测可以支持将要识别的主体从训练图片中框出的方式来标注,所以能适应更泛化的场景和环境)