【干货】如何成为深度学习工程师(上篇)
挪威的仙人掌 发布于2018-06-06 浏览:3816 回复:1
4
收藏

在正式开始前,定位和目标一定要明确好

在这里,小编理解的初阶选手,是具备了一定的计算机基础,但是对于深度学习理论和动手实操方面没接触过的筒子。通过系统学习后能够快速入门,并升级中阶。

如下是建议初阶少侠的修仙路径,需要走好这四步,即:读理论书→看视频课→实操训练→社区交流

具体怎么操作呢?别着急,逐一来看~


要看的第一本书

基础理论习得的最直接来源就是书本。按机器学习理论、深度学习理论、编程语言三个方面划分,做如下书籍阅读推荐:

【机器学习理论】

深度学习是机器学习中的一个分支,两者内在的理论基础存在很强关联。就像一个孩子在学会走路前需要学会爬,同理在掌握深度学习理论前,需要先掌握机器学习理论。

机器学习理论的书籍教材也非常多样,这里推荐一本易懂易学的书籍,可以重点关注神经网络部分。

书名:周志华《机器学习》,清华大学出版社


【深度学习理论】

打好机器学习的理论功底后,可以开始钻研深度学习的理论了。通常深度学习理论会给人留下抽象难懂的印象,且和数学结合紧密。为了让大家能够开心入门not放弃,在此推荐一份超级容易读懂的教材,无论深度学习理论还是数学理论都能一本搞定~

书名: 《深度学习》,Goodfellow, Bengio, Courville合著,赵申剑、黎彧君、符天凡和李凯合译

偶尔发现的pdf链接:https://github.com/exacity/deeplearningbook-chinese


【编程语言】

1)Python方向

看到主推语言是Python,大家可能会好奇,为啥它中选?

一方面,各大主流深度学习框架所使用的编程语言均为Python

一方面,对比其他语言,Python也是相当简单易学的!

Python的教材也非常多样,这里推荐一本实操和理论性都兼顾的教材,只要完成书中52个习题,跑代码然后发现问题解决,就能逐步上手

书名:《“笨办法”学Python》,作者Zed Shaw 王巍巍译,人民邮电出版社2014年11月版


2)C++方向

C++语言在底层框架中使用较多,在逐步掌握开源框架的基本操作后,在更高阶的框架应用中会用到这个技能点。

同前面提到的Python一样,学习C++时需要多上手操作。这里推荐迅速上手C++的书籍,不但能够学习功能和结构,还提供了解决方案的示例。

书名:《Essential C++》【美】李普曼(Lippman, S. B.)著,侯捷译,电子工业出版社2013年8月版


需要看的视频公开课

在学习一门新技术的同时,除了看书,如果有老师面对面教授,可以更快更好的学会知识。线下授课一般会固定时间和地点,且需要交学费才能听。而视频公开课能够在省钱省力的同时达到同样的面授效果~通过学习视频公开课,大家可以更轻松的理解深度学习中的抽象理论,并且也能在实操方面不绕弯路。且目前深度学习的课程多是公开免费的。

小编纵览很多课程网的深度学习公开课之后,综合课程生动性、可操作性、紧凑性、连续性这些特点,推荐如下课程,并将它们的网址一并附上,便于大家查找学习~


1)百度推出的“AI核心技术掌握“课程,每节课在20-30分钟左右,从AI技术到深度学习进行全面细致的解读。

https://ai.baidu.com/paddlepaddle/player?id=13  

2)台湾李宏毅教授的在线课程,其中是英文课程,会结合国外的科研成果,但也适合新手入门和理解深度学习

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

3)Python操作课程,从基础到进阶操作都提供详细说明,每节课在20分钟左右

 https://ai.baidu.com/paddlepaddle/openCourses 


初步训练

做好如上充足的知识储备和编程操作,当然不能纸上谈兵,这就带大家冲进深度学习的世界操练起来!

不过,先不要急着起飞,就像王者农药初期要有角色对战教学一样,我们也需要简单的实操,检测自己的学习成果。

一般遵循的路径是:选取案例→使用框架跑模型→扩大范围实践


【选取案例】

做好前面的两步铺垫,接下来进入实训阶段,那么可以到哪里找到适合初阶少侠操作的案例呢?

纵观各类文章,业内人士高频推荐如下两种深度学习模型:

房价预测:借助人工神经元和人工神经网络,深度学习模型可以借助多种特征预测出结果。一套房子的价格也受到很多因素影响,对应着深度学习模型中的多种特征。且目前房价的价格数据有成熟的数据库,不同的深度学习框架也都有房价模型。这就相当于烹饪,食材工具都已具备,火候也已经调好,遵循这些操作就可以成功啦。
鸢尾花分类:这个是图像分类中的经典模型。深度学习模型同样可以进行图像识别和分类,而图像分类操作上手难度相对较低。且鸢尾花有稳定的官方数据集——鸢尾花iris.csv,配合不同深度学习框架模型,以及其中给出的分类模型代码,就可以成功的让深度学习帮你区分鸢尾花啦!

 

问题来了:模型都需要配合深度学习框架使用,那么深度学习框架都有哪些,上哪儿找呢?

目前主流的国际化开源框架中,适合新手操作的有三种,其主要特征如下:

Tensorflow:Google出品,定位于工业级应用,跟紧技术前沿

Pytorch:定位于做研究使用,具备一定的灵活性

PaddlePaddle:百度出品,定位是成为最适合中国用户的框架,易学易用,有详细中文文档、视频课程和API。

【框架安装】

出于容易学习,以及小编工资谁发的因素,本篇文章中,小编就以深度学习框架PaddlePaddle为例介绍~

安装部分,建议使用linux系统,如果是windows系统需要安装虚拟机docker后再进行安装,具体的安装攻略可以参见小编之前的推送:

速成记|安装PaddlePaddle到底分几步?


安装成功后,在PaddlePaddle官网首页,就有房价预测模型,下载数据并复制代码后,就尽情的跑起来吧!详解链接在此请收好:

http://www.paddlepaddle.org/

【扩大范围实践】

恭喜少侠,经历初阶磨练,相信你已经有了足够的信心,有想要接触更多模型训练的冲动,享受一步步成功的快感!

如果你安装的深度学习框架是PaddlePaddle,如下链接可直达Paddle官方在Github上的模型库:

https://github.com/PaddlePaddle/models

PaddlePaddle的主站中也有部分模型可以关注

https://github.com/PaddlePaddle/Paddle 


【交流社区】

完成上述三步,少侠已经初长成,可以向深度学习的更深度进发啦!

相信你一定迫不及待想要找到队友,在使用期间遇到安装、操作、调用文档等多方面的问题也需要解决。

可以去哪里找人聊聊呢?

 

如果你使用的是PaddlePaddle,恭喜你!有队伍!

可以移步到中文交流社区,发帖寻找八方支援,或分享你的成功经验,直达链接如下:

http://ai.baidu.com/forum/topic/list/168

ps目前中文社区提问,24小时内回得到有效回复哦!


如果你使用的是Tensorflow,目前也有中文社区。不过近期小编尝试数次没能打开成功,为了避免影响大家的心情,大家也可以去如下两个中文社区论坛蹲点:

CSDN:包含行业资讯和博客文章  https://www.csdn.net/

开源中国:包含博客文章和软件产品动态资讯 https://www.oschina.net/

 

经历 阅读理论书——观看公开课视频——初阶实操——应用实战, 踏实做好每一步,深度学习工程师的初阶修炼就完成啦!接下来请期待下一篇:深度学习工程师中阶修炼指南

欢迎在下方评论区留言交流~

收藏
点赞
4
个赞
共1条回复 最后由daipeng_hi回复于2018-06-07
#2daipeng_hi回复于2018-06-07

大赞,最近正在接触入门深度学习,希望这些资料能帮助自己快速入门

0
快速回复
TOP
切换版块