,需要做以下几件事: 将每一张验证码命名为其对应的验证码内容,这是一个庞大的工作量 将命名好的验证码剪切到,但是要注意一下几点: 验证码的命名一定要对于验证码的内容,这个非常重要 裁剪的验证码会单独存放在自己对应的文件夹中,裁剪的图片会放在这里 你会发现只有33个文件夹,你应该会好奇10+26不应该是36个类别吗.因为验证码去掉了容易混淆的,只有这个这里PaddlePaddle才能读取验证码数据,在自定义图像数据集的识别这一章有介绍,如果不了解的话可以阅读该文章,想要更新本地PaddlePaddle的版本,旧版本的bug是没有对灰度的图像处理,所以在做这个灰度的验证码时会报错