在这个鸡不飞狗不叫动物园狮子都会得感冒的冬天,我和千千万万的IT民工一样,充分发挥了科技的威力——24小时无地域障碍办公。但是由于众所周知的原因,那些到岗上班的需求减少了一些,特别是下班时间后的事情少了很多,于是在家里圈养的我采取了一个不大常见的娱乐方式——参加百度的“深度学习7日入门”打卡营。这次打卡营的主题是“CV疫情特辑”,顾名思义就是以CV为主要方式做些和疫情有关的实操。课程内容是这样的:
课节1: Day01 新冠疫情可视化 https://aistudio.baidu.com/aistudio/projectdetail/388471
课节2: Day02 手势识别 https://aistudio.baidu.com/aistudio/projectdetail/390719
课节3: Day03 车牌识别 https://aistudio.baidu.com/aistudio/projectdetail/392707
课节4: Day04 口罩分类 https://aistudio.baidu.com/aistudio/projectdetail/394795
课节5: Day05 PaddleHub体验,比赛 https://aistudio.baidu.com/aistudio/projectdetail/396427
课节6: Day06 PaddleSlim模型压缩
下面是记录的每日流水账,标志到此一游,作用是打卡备忘。
第一天2个作业:一是提交安装paddle成功的截图,很容易。第2个是使用百度的echart显示爬下来的全国疫情数字。虽说我手头有爬丁香园的代码,但是看着百度为小白做好的车轮,我该怎么选择?当然是厚着脸皮坐上去啊。成绩出来比较郁闷,那些早上8点做出来的同学基本都是100分,我报名晚,看到题晚,虽说也是马上做完提交的,也只有98分。2分的差距简直太大了!为啥这么说呢,您看后边就知道了。
第二天,使用预设数据集( https://aistudio.baidu.com/aistudio/datasetdetail/23668 )编写模型,识别手势表示数字是多少。原题要求是DNN,老师把车搬出来了,就差几个发动机的螺丝让我们填。晚上在老师讲课之前,找到了对应的文档。课上看老师的示例,学到了动态图方式下,检查维度匹配的好方法。顺便说一下,这次课程都是基于动态图完成的。从本节课开始,评分和模型效果相关了,比如今天就是按识别正确率评分,为了多挣几分,我把网络换成了CNN。
第三天,提供的数据集是黑白的文字小图片( https://aistudio.baidu.com/aistudio/datasetdetail/23617 ),要求从照片识别出车牌号。老师讲的网络是CNN,所以今天的课上的很平淡。学到的方法是用open cv把字抠出来依次识别。
第四天,说是口罩分类,其实就是检查照片中的人是否戴口罩,百度有个做的很不错的口罩监测模型,但是老师今天讲的是VGG16,我试了下,比ResNet识别率高。
第五天,全国沉浸在为疫情中牺牲的勇士和死难者的哀悼中,夜幕降临后,看到提供了录播的课程。本日作业是实验PaddleHub 识别口罩。今天发布了比赛题目:人流密度检测。
第六天,作业是有关剪枝、蒸馏、量化的理论题5道,以及paddleSlim的使用实践。课上老师讲了模型paddleSlim优化人流密度检测的原理,可惜有些原理分析的不是很细,但是看文档也能补上。
从第5天开始,能找出的时间都用来优化比赛模型了,可惜现在打卡和比赛都没有结束,相关的代码和详细分析只能以后再发了。
最后吐槽下AI Studio,这次后台算力明显不足,好在各位老师想办法增加了资源。AI Studio有个问题长期存在,就是如果在运行时刷新了页面,不管你是误关闭了、浏览器崩了、回家继续跑等等,你就再也看不到print的输出了,看着火听着声炼丹已经够熬人的了,一下变成了在产房外边等娃出世,对心理考验又提升到了新阶段。为了对付这个问题,做了个小东西,在这里: https://github.com/nemon-/tools4paddle ,求star。在ai studio上有使用说明示例,在这里: https://aistudio.baidu.com/aistudio/projectdetail/380314 ,有兴趣fork一下试试吧。
谢谢鼓励
百度资源利用得很充分啊。最近又做新技能了么?
加油,共同进步。