资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

识图任务

API文档

识图任务API

Config API

update_dataset(dataset_dir, dataset_type=None)

更新数据集路径与数据集类型。

输入参数

  • dataset_dir (str):数据集存储路径。支持使用绝对路径或相对路径。
  • dataset_type (str|None):数据集类型,备选项有:'ShiTuDataset'。若为None,使用默认的数据集类型:'ShiTuDataset'。默认值:None

update_learning_rate(learning_rate)

更新学习率。

输入参数

  • learning_rate (float):学习率。如果模型训练使用学习率衰减策略,此参数指定的是基准学习率。

update_batch_size(batch_size, mode='train')

更新mini-batch大小。

输入参数

  • batch_size (int):Mini-batch大小。如果使用数据并行,此参数指定的是每个设备上的mini-batch大小。
  • mode (str):batch_size适用的阶段。备选项有:'train'。默认值:'train'

update_pretrained_weights(weight_path, is_backbone=False)

更新用于模型初始化的预训练权重参数文件路径。

输入参数

  • weight_path (str):需要加载的权重参数文件路径,例如best_model/model.pdparams
  • is_backbone (bool):若为True,则weight_path包含的权重参数将被用于初始化模型骨干网络(backbone);否则,权重参数将被用于初始化整个模型。默认值:False

update_num_classes(num_classes)

更新使用的数据集中的类别数量。

输入参数

  • num_classes (int):类别数量。

Model API

train(batch_size=None, learning_rate=None, epochs_iters=None, pretrained=None, ips=None, device='gpu', resume_path=None, dy2st=False, amp='OFF', num_workers=None, use_vdl=True, save_dir=None, **kwargs)

执行模型训练。

输入参数

  • batch_size (int|None):模型训练阶段使用的mini-batch大小。若为None,则使用默认配置。默认值:None
  • learning_rate (float|None):模型训练阶段使用的学习率。如果使用学习率衰减策略,此参数指定的是基准学习率。若为None,则使用默认配置。默认值:None
  • epochs_iters (int|None):模型训练阶段的总迭代次数。若为None,则使用默认配置。默认值:None
  • pretrained (str|None):用于初始化模型的预训练权重参数文件路径,例如pretrained/model.pdparams。若为None,则使用默认配置。默认值:None
  • ips (str|None):多机训练时各机器的IP地址,用,分隔。若为None,则使用默认配置。默认值:None
  • device (str):指定模型训练阶段使用的设备,支持指定设备编号。请参考设备字符串。默认值:'gpu'
  • resume_path (str|None):模型权重参数文件路径,例如epoch_1/model.pdparams。。训练将从resume_path指定的文件对应的检查点继续进行。若为None,则使用默认配置。默认值:None
  • dy2st (bool):是否启用模型动转静训练。默认值:False
  • amp (str):备选项有:'OFF''O1''O2'。若为'OFF',则不启用自动混合精度训练;若为'O1',则使用O1等级的自动混合精度训练;若为'O2',则使用O2等级的自动混合精度训练。默认值:'OFF'
  • num_workers (int|None):加载、预处理数据使用的子进程个数。若为None,则使用默认配置。默认值:None
  • use_vdl (bool):是否启用VisualDL。默认值:True
  • save_dir (str|None):输出存储目录。若为None,则使用默认配置。默认值:None
  • **kwargs:以键值对形式提供定制模型训练阶段行为的附加参数。目前暂时没有支持的附加参数。

evaluate(weight_path, batch_size=None, ips=None, device='gpu', amp='OFF', num_workers=None, **kwargs)

执行模型精度验证。

输入参数

  • weight_path (str):需要加载的权重参数文件路径,例如best_model/model.pdparams
  • batch_size (int|None):模型精度验证阶段使用的mini-batch大小。若为None,则使用默认配置。默认值:None
  • ips (str|None):多机验证时各机器的IP地址,用,分隔。若为None,则使用默认配置。默认值:None
  • device (str):指定模型精度验证阶段使用的设备,支持指定设备编号。请参考设备字符串。默认值:'gpu'
  • amp (str):备选项有:'OFF''O1''O2'。若为'OFF',则不启用自动混合精度验证;若为'O1',则使用O1等级的自动混合精度验证;若为'O2',则使用O2等级的自动混合精度验证。默认值:'OFF'
  • num_workers (int|None):加载、预处理数据使用的子进程个数。若为None,则使用默认配置。默认值:None
  • **kwargs:以键值对形式提供定制模型精度验证阶段行为的附加参数。目前暂时没有支持的附加参数。

predict(weight_path, input_path, device='gpu', save_dir=None, **kwargs)

执行动态图模型推理。

输入参数

  • weight_path (str):需要加载的权重参数文件路径,例如best_model/model.pdparams
  • input_path (str):输入图像路径。
  • device (str):指定动态图模型推理阶段使用的设备,不支持指定设备编号。请参考设备字符串。默认值:'gpu'
  • save_dir (str|None):输出存储目录。若为None,则使用默认配置。默认值:None
  • **kwargs:以键值对形式提供定制动态图模型推理阶段行为的附加参数。目前暂时没有支持的附加参数。

export(weight_path, save_dir, **kwargs)

执行预测模型导出。

输入参数

  • weight_path (str):需要加载的权重参数文件路径,例如best_model/model.pdparams
  • save_dir (str):预测模型的存储目录。
  • **kwargs:以键值对形式提供定制预测模型导出阶段行为的附加参数。目前暂时没有支持的附加参数.

infer(model_dir, input_path, device='gpu', save_dir=None, **kwargs)

执行预测模型推理。

输入参数

  • det_model_dir (str):检测预测模型的存储目录。
  • rec_model_dir (str):识别预测模型的存储目录。
  • index_dir (str):索引库存储目录。
  • label_file_path (str|None):数据集的类别映射文件存储路径。若为None,则使用默认配置。默认值:None
  • input_path (str):输入图像路径。
  • device (str):指定预测模型推理阶段使用的设备,不支持指定设备编号。请参考设备字符串。默认值:'gpu'
  • save_dir (str|None):输出存储目录。若为None,则使用默认配置。默认值:None
  • **kwargs:以键值对形式提供定制预测模型推理阶段行为的附加参数。目前暂时没有支持的附加参数。

compression(weight_path, batch_size=None, learning_rate=None, epochs_iters=None, device='gpu', use_vdl=True, save_dir=None, **kwargs)

执行模型压缩。模型压缩分为2个步骤:首先执行量化感知训练,然后执行预测模型导出。

输入参数

  • weight_path (str):需要加载的权重参数文件路径,例如best_model/model.pdparams
  • batch_size (int|None):模型压缩阶段使用的mini-batch大小。若为None,则使用默认配置。默认值:None
  • learning_rate (float|None):模型压缩阶段使用的学习率。如果使用学习率衰减策略,此参数指定的是基准学习率。若为None,则使用默认配置。默认值:None
  • epochs_iters (int|None):模型压缩阶段的总迭代次数。若为None,则使用默认配置。默认值:None
  • device (str):指定模型压缩阶段使用的设备,支持指定设备编号。请参考设备字符串。默认值:'gpu'
  • use_vdl (bool):是否启用VisualDL。默认值:True
  • save_dir (str|None):输出存储目录。若为None,则使用默认配置。默认值:None
  • **kwargs:以键值对形式提供定制模型压缩阶段行为的附加参数。支持的附加参数如下:

    • input_shape (list[int]):预测模型输入的张量尺寸,如[1, 3, 224, 224]
上一篇
名词解释
下一篇
图像分类任务