数据集智能标注功能
MercyShaw 发布于2019-07-17 17:48 浏览:8420 回复:18
2
收藏
最后编辑于2020-10-28

在深度学习的模型开发过程中,充足的数据集及精准的数据标注对最终模型效果来说至关重要:就物体检测模型来说,预估开发者们花在数据标注上的时间平均会占据整个项目周期的50%以上。尤其是企业用户、科研人员做的高精度定制化模型,需要在深度学习的过程中投喂海量数据去训练。而通常情况下,面对这些庞大的数据集,开发者们只能人工手动去一张张标注图片,整个过程耗时长,另外还需要对标注人员进行相关知识培训,综合操作成本非常高。

百度EasyDL的物体检测功能最近推出了“智能标注”功能,这篇文章会跟大家简单介绍一下这个功能的操作。毕竟在“智能标注”的帮助下,开发者们只需标注数据集中系统推荐优先处理的重点图片,就可以让EasyDL后台自动标注剩余的图片,还是很值得试一试的。

“智能标注”是EasyDL数据中心的一个辅助功能,刚刚用了一个简单的(识别动物的)物体检测模型数据集实测了一下,发现开启”智能标注“功能,只需标注原数据集中30%的图片,就能让后台启动数据集预标注,并能够选择”一键标注“剩余数据集了。对比手工标注训练出的模型效果,开启智能标注训练的模型效果同样达到了95%以上,的确是又省时又省力,不要太方便啊!

好了,废话不多说,使用 “智能标注”非常简单,只需在EasyDL的物体检测模型后台按照以下三个步骤操作即可:

1. 启动智能标注

选择EasyDL定制化图像识别的“物体检测”模型后,在“数据中心”上传完训练数据集后,即可在标注页面下方找到“智能标注”功能的启动入口。启动前,先选择一个数据集,每个标签标注至少10个框,来为“智能标注”的开启做好准备工作。

点击右下角绿色的”启动智能标注“按钮即可开启该功能。

2. 标注代表图片

启动后,系统会自动筛选出数据集中最具有代表性、也是最需要优先标注的图片。开发者可根据提示,对需要优先标注的图片进行标注。除了人工标注之外,还可以勾选 “显示预标注”功能来提升标注效率:只需确认或调整系统预标注的标注框,即可完成重点图片的标注过程。

系统筛选出优先标注的图片,还可勾选“显示预标注”来协助处理数据集。

3. 一键标注剩余图片

标注重点图片后,当系统判断当前标注的图片已足够、且EasyDL展示的预标注已十分精准时,用户可随时启动“一键标注”来批量处理剩余图片的标注。“一键标注”完成后,所有系统标注的图片都会出现在“待确认”类别中,只需对系统标注结果进行确认即可轻松完成所有数据的标注。


好了,就是这么简单,三步即可完成数据集的智能标注。EasyDL的这个功能给开发者们省了很多时间,想到以后再也不用一张张手动无序地标注图片了,忍不住笑了出声。期待“智能标注”的功能也能尽快在文本、声音、和视频的模型中赋用吧。

收藏
点赞
2
个赞
共18条回复 最后由周小鱼whoyou回复于2020-10-28 11:22
#19周小鱼whoyou回复于2020-10-28 11:22:45

使用过智能标注,确实能够自动完成,只需要人工进行审核即可。

0
#18回复于2020-10-05 10:42:05
print(1)
0
#17wangwei8638回复于2020-09-03 13:02:41
#16 188******76回复
希望能再出一个数据集导出的功能

同感

0
#16188******76回复于2020-08-28 08:08:21

希望能再出一个数据集导出的功能

0
#15wangwei8638回复于2020-05-29 13:22:11
#8 wildwood10回复
没有工具可以下载标注数据很不方便

这是个好建议,可以反馈

0
#14wangwei8638回复于2020-05-29 13:21:25
#11 来趣网络是骗子回复
需要收费吗

不收

0
#13rosking丶重生回复于2020-05-15 23:16:56

上传自己已经标注的图片老是失败。。。

0
#12小月1313回复于2020-04-03 17:09:31

可以给图片快速ps不,比如给在人像上加装饰,眼镜,帽子什么的

0
#11来趣网络是骗子回复于2020-03-26 01:23:21

需要收费吗

0
#10rose20135188回复于2019-10-25 15:40:10
#9 追逐自我lzl回复
请问下,对于文本标注,训练样本标注好后,扔进去,然后test,假设出现了没有识别出类别的数据案例,这样的话easydl可以实现手工自动标注吗,然后在迭代训练,在测试?
展开

没识别出来的,应该可以手动标注,然后再迭代训练,测试。

0
#9追逐自我lzl回复于2019-10-22 22:59:15

请问下,对于文本标注,训练样本标注好后,扔进去,然后test,假设出现了没有识别出类别的数据案例,这样的话easydl可以实现手工自动标注吗,然后在迭代训练,在测试?

0
#8wildwood10回复于2019-10-15 09:36:40

没有工具可以下载标注数据很不方便

1
#7rose20135188回复于2019-09-20 10:18:26
#4 hadoopspark回复
楼主,发现你们的产品还有一个重要的功能没有想到,我很需要这个功能:就是我以前自己用其他工具标注过一些图片,现在如果要用百度的easydl,需要重新手工标注一遍,很不方便,我觉得开发一个接口,能够把以前用其他工具标注过的数据自动上传到我的百度数据集里面去,就不用重新再标注一次,不知道听懂了没有
展开

提议很好,楼主可以考虑一下

1
#6rose20135188回复于2019-09-20 10:17:50

这个好,可以节省大量时间。

0
#5wangwei8638回复于2019-08-27 22:18:23

智能的智能

0
#4hadoopspark回复于2019-08-24 00:04:38

楼主,发现你们的产品还有一个重要的功能没有想到,我很需要这个功能:就是我以前自己用其他工具标注过一些图片,现在如果要用百度的easydl,需要重新手工标注一遍,很不方便,我觉得开发一个接口,能够把以前用其他工具标注过的数据自动上传到我的百度数据集里面去,就不用重新再标注一次,不知道听懂了没有

0
#3lwy441889928回复于2019-07-29 18:30:03

能大概告知下智能标注的原理吗?谢谢

0
#2付洋洋carrie回复于2019-07-25 10:15:54

优秀

0
TOP
切换版块