# 图像分类训练操作说明
数据提交后,可以在导航中找到【训练模型】,按以下步骤操作,启动模型训练:
注意事项:
- 1.启动训练前请确保数据已经标注完成,否则无法启动训练
- 2.下述训练功能点中,标注为星号(*)的功能为非必要选择项,可根据实际需求考虑是否使用
# 添加数据
添加训练数据 先选择数据集,再按分类选择数据集里的图片,可从多个数据集选择图片 模型效果和训练时间与数据量大小有关,数据量越大,理论上模型效果越好,训练耗时也越长
# 添加自定义验证集*
AI 模型在训练时,每训练一批数据会进行模型效果检验,以某一张验证图片作为验证数据,通过验证结果反馈去调节训练。 如果没有指定,训练时会从训练数据中随机选择部分图片作为验证集。 验证集不能是训练集的子集
# 添加自定义测试集*
用于检验模型效果,输出模型评估报告。测试集不能是训练集的子集。 不同训练版本,指定同一个测试集时,可以更加客观的对比不同的模型版本训练效果
# 数据增强策略
数据增强策略可以设置图片增广倍数以及勾选样本均衡来提升训练数据质量,进而训练出准确率更高的模型。
图片增广倍数是指在数据增广过程中,对于每张原始图像生成的增广样本数量相对于原始图像的倍数。通过增加图像数量,可以扩展数据集,提高模型的泛化能力和鲁棒性
样本均衡是一种图像处理技术,旨在通过扩充样本数量,使不同类别的样本在数据集中达到平衡。在图像增广过程中,样本均衡可以确保每个类别的样本数量都扩充到与数量最多的类别相当,从而提高模型的性能和鲁棒性。
目前支持 6 种算子,这些算子可以单独使用,也可以组合在一起,根据具体需求灵活选择。在实际应用中,数据增强策略的选择应考虑数据集的特点和任务的要求,通过增加样本的多样性来提升模型的泛化性能。
FlipLR:左右翻转图像,能更好地识别发生了左右翻转的图像
FlipUD:上下翻转图像,能更好地识别发生了上下翻转的图像
Rotate:旋转图像,能更好地识别发生了旋转的图像
TranslateX:水平移动图像,能更好地识别发生了水平方向移动的图像
TranslateY:垂直移动图像,能更好地识别发生了垂直方向移动的图像
Color:调整图像颜色平衡,能更好地根据轮廓识别图像
# 图像分辨率
模型效果和训练时间与设置的分辨率有关,分辨率过小,模型训练效果可能比较差。分辨率越大,训练耗时越长。
# 训练配置
# learning rate
learning rate:学习率,也称为步长。 学习速率代表了神经网络中随时间推移,信息累积的速度。学习率是最影响性能的超参数之一,相比于其它超参数学习率以一种更加复杂的方式控制着模型的有效容量,当学习率最优时,模型的有效容量最大 学习率越大, 输出误差对参数的影响就越大, 参数更新的就越快, 但同时受到异常数据的影响也就越大, 很容易发散
# epoch
epoch:训练集完整参与训练的次数。如有训练数据集较大,模型训练不充分,模型精度较低的情况,可适当设置较大 epoch 值(大于 100),使模型训练更完整。
# 增量训练
选择该模型下的已训练版本,在数据应用场景不变的情况下,扩充数据来进行增量训练,提升模型训练效率和精度
# 训练服务器环境
平台提供付费算力,付费算力可用于模型训练。一般来讲,训练服务器配置越高,训练速度越快。
← 图像分类创建模型 图像分类模型效果评估 →