在深度学习的模型开发过程中,充足的数据集及精准的数据标注对最终模型效果来说至关重要:就物体检测模型来说,预估开发者们花在数据标注上的时间平均会占据整个项目周期的50%以上。尤其是企业用户、科研人员做的高精度定制化模型,需要在深度学习的过程中投喂海量数据去训练。而通常情况下,面对这些庞大的数据集,开发者们只能人工手动去一张张标注图片,整个过程耗时长,另外还需要对标注人员进行相关知识培训,综合操作成本非常高。
百度EasyDL的物体检测功能最近推出了“智能标注”功能,这篇文章会跟大家简单介绍一下这个功能的操作。毕竟在“智能标注”的帮助下,开发者们只需标注数据集中系统推荐优先处理的重点图片,就可以让EasyDL后台自动标注剩余的图片,还是很值得试一试的。
“智能标注”是EasyDL数据中心的一个辅助功能,刚刚用了一个简单的(识别动物的)物体检测模型数据集实测了一下,发现开启”智能标注“功能,只需标注原数据集中30%的图片,就能让后台启动数据集预标注,并能够选择”一键标注“剩余数据集了。对比手工标注训练出的模型效果,开启智能标注训练的模型效果同样达到了95%以上,的确是又省时又省力,不要太方便啊!
好了,废话不多说,使用 “智能标注”非常简单,只需在EasyDL的物体检测模型后台按照以下三个步骤操作即可:
1. 启动智能标注
选择EasyDL定制化图像识别的“物体检测”模型后,在“数据中心”上传完训练数据集后,即可在标注页面下方找到“智能标注”功能的启动入口。启动前,先选择一个数据集,每个标签标注至少10个框,来为“智能标注”的开启做好准备工作。
点击右下角绿色的”启动智能标注“按钮即可开启该功能。
2. 标注代表图片
启动后,系统会自动筛选出数据集中最具有代表性、也是最需要优先标注的图片。开发者可根据提示,对需要优先标注的图片进行标注。除了人工标注之外,还可以勾选 “显示预标注”功能来提升标注效率:只需确认或调整系统预标注的标注框,即可完成重点图片的标注过程。
系统筛选出优先标注的图片,还可勾选“显示预标注”来协助处理数据集。
3. 一键标注剩余图片
标注重点图片后,当系统判断当前标注的图片已足够、且EasyDL展示的预标注已十分精准时,用户可随时启动“一键标注”来批量处理剩余图片的标注。“一键标注”完成后,所有系统标注的图片都会出现在“待确认”类别中,只需对系统标注结果进行确认即可轻松完成所有数据的标注。
好了,就是这么简单,三步即可完成数据集的智能标注。EasyDL的这个功能给开发者们省了很多时间,想到以后再也不用一张张手动无序地标注图片了,忍不住笑了出声。期待“智能标注”的功能也能尽快在文本、声音、和视频的模型中赋用吧。
优秀