虽然工作压力比较大,各方面都比较局促,但是看到“Python小白逆袭大神”这种口号,还是没经得起诱惑,参加了这个打卡营。
记忆力“逆袭大神”这种事,只有在大神犯晕、伪神穿帮、巨神扮小白,以及小白物理上给了大神一闷棍的情境下出现过,但是谁还没有个美好的梦想啊,万一看别人实现了呢?反正进打卡营又不考T、考G考人民币,厚着脸皮上呗。
本次课表及内容如下:
课节1: 前置课程
[项目]AI Studio基本操作(一) Notebook篇
课节2: Day1-人工智能概述与入门基础
[项目]python基础
[文档]人工智能概述与入门基础
[视频]开营介绍
[视频]理论:人工智能概述与入门基础
[视频]实践:Python基础
课节3: Day2-Python进阶
[项目]Python进阶练习
[文档]深度学习实践平台与Python进阶
[视频]视频:Python进阶实践
课节4: Day3-人工智能常用Python库
[项目]深度学习常用Python库介绍
[文档]深度学习常用Python库
[视频]视频:四种深度学习常用Python库
课节5: Day4-PaddleHub体验与应用
[项目]PaddleHub体验
[项目]PaddleHub之《青春有你2》进行二分类
[文档]PaddleHub体验与应用
[项目]PaddleHub体验-New
[视频]PaddleHub体验与应用-2
[视频]PaddleHub体验与应用-1
课节6: Day5-EasyDL体验与作业发布
[文档]EasyDL体验与作业发布
[视频]视频:EasyDL体验与作业
课节7: Day6-PaddleHub创意赛发布
[视频]PaddleHub创意赛发布+作业解析
说是7天,但实际只有5天有视频,结合作业来看:
Day1-Python基础练习
Day2-《青春有你2》选手信息爬取
Day3-《青春有你2》选手数据分析
Day4-《青春有你2》选手识别
Day5-综合大作业
前置课程就是开课之前自学的。
第一天讲的是人工智能概述和python基础,很简单。作业两个,第一个是输出乘法口诀,要求根据示例输出,猜出打印方式为 print("%d*%d=%d"%(j,i,i*j),end='\t');第二个是查找指定文件,考察会不会用os.walk。
第二天是Python进阶,学习深了一丢丢儿,作业容易了一些,是爬《青春有你2》节目的选手信息,框架里已经写了爬文字信息的代码,要求补全爬照片的代码。我先拿每个选手的百度百科相册封皮试了一下,109张很快;第二版,抓选手的默认相册的内容图,粗心了,抓了482张缩略图;第三版抓选手的默认相册的内容大图,还是482张;第四版,找到选手对应的全部图册链接,抓全部相册所有图片。这时发现,每个相册只能抓下30张图,超过的是ajax加载,不在页面里,于是找到了ajax请求。当时太晚了,先睡了,到第二天看群里记录,有人发现了不加后缀取到的不仅是大图而且没水印。于是综合修改,最后抓到1541张。
第三天,讲numpy等4个常用库,作业是画图,示例是柱状图,自己实现饼图,于是到matplotlib上翻找例子,然后修改一下。难度貌似提高了,实际工作量少了,算是休息一天。
第四天,讲paddlehub的有趣应用例子,作业要求用自己爬取的图片做成数据集训练,最终得分与识别结果相关。我先把爬的图都放进去跑了一遍,正确率60%,看了下识别错误的那两名选手的训练数据,马上意识到问题了,一个是只有4张图,另一个是一堆合影。于是打开搜索引擎,搜了一堆图,扔到文件夹里。这时群里有人抱怨选手淘汰早照片就少,开玩笑说把测试集放到训练集里肯定acc100%,吓我一跳,赶紧检查了一下,把漏进去的2张照片删了。然后跑出acc 0.8。看了下,发现还是数据质量的问题,清理了电视剧招贴画和一人没有的海报,全部通过。然后手痒,自己做了个增强的函数,纯PIL的,开跑之后,开始acc 0.8,后来上蹿下跳,低至 0.4 。没想明白,没敢保存结果。后来想明白了,旋转的时候,背景是黑的,和某些选手的暗色背景有点类似。paddle熊孩子不学好,过拟合了。
第五天,老师讲了EasyDL,懒人福利,上传少量样本即可获得很好的效果。作业突然加大难度和工作量,要求爬取爱奇艺上《青春有你2》留言评论,统计高频词,还有就是用paddlehub自动审核内容。靠老师直播视频和后来挂出的视频(很模糊),大概知道了用jieba.lcut、plt.bar、WordCloud、hub.Module(name="porn_detection_lstm").detection来实现,有些细节没看清,但是第一步爬评论算是有门道了。第二天,放全屏随时拷屏(这算是良知的堕落还是学渣的哀伤?),搞出来了一看,啥乱七八糟的?然后做了个词语修正,把明显输错了名字的给纠正一下,提交第二版。下班后又觉得应该把柱状图弄成横着的,可是中文打印出来都是方格,搞定了已经过了最后提交时间,只好在这里放出来了。
总的来讲,这次的课程偏重数据准备和预处理,适合在互联网这个大池子里摸鱼的同学,也适合炼丹底子厚,想体验一下采药的同学。
DL是个系统工程,成分多样、结构复杂,每个人其实都有机会成为自己那个领域的大神,专注做好就有希望。小白逆袭大神?反正我信了。借用热词词频最高的两个字,送给每一个人,也送给自己:加油!
大神,能利用小度开发一个局域网或者广域网唤醒电脑和NAS的技能吗?
关注啦,以后一起玩dl哈
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/52739
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76563
【一些项目,有空可以fork玩玩】
训练数据太少?过拟合?一文带你领略“数据增长魔法”(上) (https://aistudio.baidu.com/aistudio/projectdetail/408059)
训练数据太少?过拟合?一文带你领略“数据增长魔法”(下) (https://aistudio.baidu.com/aistudio/projectdetail/422256)
一文帮你理解用Paddle训练模型的原理1-手写回归模型 (https://aistudio.baidu.com/aistudio/projectdetail/367090)
一文帮你理解用Paddle训练模型的原理2-权值可视化(VisualDL) (https://aistudio.baidu.com/aistudio/projectdetail/386954)
我也信~~不为得永生~~只为活的更好~~
加油!共同努力!摘不摘得仙丹不敢说~~怎么炉子也得扛俩回去~~