0.数据集的获取:kaggle,飞桨,阿里天池,论文,国外网站等 1 安装相关的库(pyqt等等)和labelimg(4)剪裁 (5)平移 (6)调整亮度、对比度、饱和度、色差等等 (7)注入噪声 (8)基于生成对抗网络与相关知识领域数据结合,特征融合 6、数据清理 转换数据类型,处理缺失数据,处理离群数据 7、特征变换 特征数值化,特征二值化,One-hot编码,特征离散化特征,规范化(区间变换、标准化、归一化) 8、特征选择 封装器法(循序特征选择,穷举特征选择,递归特征选择),过滤器法,嵌入法 9、特征抽取 监督学习特征抽取与无监督学习特征抽取