资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

可视化工具

简介

  • 为了能更好的展示模型结构、可视化模型指标,方便用户把控训练流程,文心接入了VisualDL可视化工具包,并对其进行了封装。

准备工作

  1. 准备环境:使用可视化工具,首先得在自己的开发机上安装好visual dl包,具体安装教程可参考https://www.paddlepaddle.org.cn/documentation/docs/zh/1.7/advanced_guide/evaluation_debugging/debug/visualdl.html
  2. 配置任务参数,使用wenxin工具包,运行过程中生成可视化log 。如下图所示,如果需要保存可视化log,在json配置文件的trainer节点中将metrics_visual设置为true(默认为false),visual_log_dir为log保存路径(默认为./visual_log)。可视化log保存的内容为用户的model文件中, get_metrics接口所返回的dict中的每一项指标值。需要注意的是,目前指标可视化只能展示数值类型的标量值,如int,float,double,其他数据类型(如numpy,array等)会抛异常。
{......
"model": {
    "type": "BiLSTMClassification",
    "optimization": {
      "learning_rate": 2e-05
    },
    "vocab_size": 33261,
    "num_labels": 2
  },
  "trainer": {
    "PADDLE_USE_GPU": 0,
    "PADDLE_IS_LOCAL": 1,
    "train_log_step": 20,
    "is_eval_dev": 0,
    "is_eval_test": 1,
    "eval_step": 100,
    "save_model_step": 10000,
    "load_parameters": 0,
    "load_checkpoint": 0,
    "use_fp16": 0,
    "pre_train_model": [],
    "output_path": "./output/cls_bilstm_ch",
    "metrics_visual": true,
    "visual_log_dir": "./visual_log",
    "extra_param": {
      "meta":{
        "job_type": "text_classification"
      }
 
    }
  }
}

开始使用

  1. 按正常的训练脚本启动训练任务即可,任务运行过程中,可视化日志会保存到visual_log_dir对应的目录下。 python run_with_json --param_path=./examples/xxx_ch.json
  2. 找到你自己安装的visualdl路径,执行 visualdl --logdir visual_log_dir --host 0.0.0.0 --port 8088
  3. 查看你当前机器的ip地址,然后在浏览器中输入http://ip:8088/
  4. 如果需要可视化模型的网络结构,那么首先将你自己保存好的save_inference_model/路径下的model文件重命名为model , 然后执行 visualdl --host 0.0.0.0 --port 8088 --model model
  5. 如果需要同时可视化指标和网络结构,则执行visualdl --logdir visual_log_dir --host 0.0.0.0 --port 8088 --model model
  6. Ernie的网络因为文心底层做了些处理,目前暂不支持网络结构的可视化。