【2021新春福袋】我用百度大脑体验了人脸识别
screamdw 发布于2021-01 浏览:3231 回复:1
0
收藏
最后编辑于2022-04

(1)准备数据集

【1.用来存放自定义图片的目录——/home/aistudio/images/face】

【2.用来存放图像列表的目录——/home/aistudio/face/】

【3.model_vgg用来存放vgg网络训练的模型】

【4.model_cnn用来存放cnn网路训练的模型】 

(2)搭建网络

配置网络主要是用来组建一个Program,主要包括三个部分:1.网络模型2.损失函数3.优化函数
搭建的CNN网络

搭建VGG网络

1.首先定义了一组卷积网络,即conv_block。卷积核大小为3x3,池化窗口大小为2x2,窗口滑动大小为2,groups决定每组VGG模块是几次连续的卷积操作,dropouts指定Dropout操作的概率。所使用的img_conv_group是在paddle.networks中预定义的模块,由若干组 Conv->BN->ReLu->Dropout 和 一组 Pooling 组成。

2.五组卷积操作,即 5个conv_block。 第一、二组采用两次连续的卷积操作。第三、四、五组采用三次连续的卷积操作。每组最后一个卷积后面Dropout概率为0,即不使用Dropout操作。

3.最后接两层512维的全连接。

4.通过上面VGG网络提取高层特征,然后经过全连接层映射到类别维度大小的向量,再通过Softmax归一化得到每个类别的概率,也可称作分类器。

(2)定义数据层

image 和 label 是通过 fluid.layers.data 创建的两个输入数据层。其中 image 是 [3, 100, 100] 维度的浮点数据; label 是 [1] 维度的整数数据。

这里需要注意的是: Fluid中默认使用 -1 表示 batch size 维度,默认情况下会在 shape 的第一个维度添加 -1 。 所以 上段代码中, 我们可以接受将一个 [-1, 3, 100, 100] 的numpy array传给 image 。Fluid中用来做类别标签的数据类型是 int64,并且标签从0开始。

Step3.模型训练 and Step4.模型评估
(1)创建Executor

首先定义运算场所 fluid.CPUPlace()和 fluid.CUDAPlace(0)分别表示运算场所为CPU和GPU

Executor:接收传入的program,通过run()方法运行program。

训练分为三步:第一步配置好训练的环境,第二步用训练集进行训练,并用验证集对训练进行评估,不断优化,第三步保存好训练的模型

(4)训练并保存模型

Executor接收传入的program,并根据feed map(输入映射表)和fetch_list(结果获取表) 向program中添加feed operators(数据输入算子)和fetch operators(结果获取算子)。

feed map为该program提供输入数据。fetch_list提供program训练结束后用户预期的变量。

这次训练5个Pass。每一个Pass训练结束之后,再使用验证集进行验证,并求出相应的损失值Cost和准确率acc。

https://aistudio.baidu.com/aistudio/projectdetail/595792

收藏
点赞
0
个赞
共1条回复 最后由用户已被禁言回复于2022-04
#2189******30回复于2021-02

cool

0
TOP
切换版块