卷积神经网络笔记

首页版块访问AI主站注册发帖

卷积神经网络笔记

JavaRoom 发布于2020-04 浏览:2964 回复:1

卷积神经网络笔记

快速回复

卷积神经网络学习笔记
分类
卷积层+激活层+池化层的组合多次出现提取特征值
多个全连接或特殊的CNN结构作为输出层作分类器、检测器、分割器
计算机视觉主要任务左图展示了四种主要的计算机视觉任务（由粗粒度到精细粒度）
1、图像分类（what）为图像赋予一个或多个语义标签
2、目标检测（what & where ）找到图像中物体的类别及所在位置
3、图像语义分割（what & where ）找到图像中物体的类别并精确勾勒出其所在位置
4、图像实例分割（what & where ）多个同类物体存在时，将它们一一区分出来
数据集
1.fifar数据集
http://www.cs.toronto.edu/~kriz/cifar.html
60000张32*32 的RGB图像
10个互斥的类别，每类6000张图片
训练：50000张，5个训练批，每批10000张每类图像随机抽取，张数不平均ü测试：
10000张，单独构成一批，每类1000张
2.ImageNet数据集
http://image-net.org
训练集：1,281,167张图片+标签
验证集：50,000张图片+标签
测试集：100,000张图片1000个类别，每个类别1000多张图像
经典CNN结构探索
AlexNet
VGG
GoogLeNet/Inception
ResNet
VGG

牛津大学视觉几何计算组

深度增加& 小卷积核->对网络最后的分类识别效果有很大作用
小卷积核：3*3：表示上下、左右、中心这些概念的最小卷积核尺寸
深度：AlexNet 8 层àVGG最深19层

课程资源

个赞

共1条回复最后由小马奔特回复于2020-05

#2小马奔特回复于2020-05

赞一个

快速回复

小编推荐

三分钟识别所有小动物！

金天皇上 77回复

邀测 | 红酒识别技术申请试用抢先体验

用户已被禁言 23回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服