EasyDL常见QA
秀秀000521 发布于2018-07-17 15:39 浏览:5856 回复:11
1
收藏
快速回复
最后编辑于2020-06-24

EasyDL是百度于2017年11月推出的定制化训练和服务平台,目前支持图像分类、物体检测、声音分类三类识别模型的定制训练。

产品使用全程可视化操作,无需任何机器学习基础:创建模型—数据上传与标注—训练模型并校验效果—模型发布,即可拥有定制化模型。
EasyDL的特点是训练数据少精度高:每个模型单个识别标签只需标注20-100张图片/声音即可训练一个高精度的模型,目前线上超过2/3的准确度在90%以上,绝大多数模型准确率在80%以上。一般来说,单个模型的平均训练时间只需15分钟左右;物体检测的训练时间平均在30分钟左右。

EasyDL训练完成的模型可在平台上直接申请发布,可获得API云服务和离线sdk两种形式的产品,也可以支持直接发布成h5 demo。可灵活集成在手机、摄像头等终端设备场景

 

 欢迎体验,下面介绍一下使用过程中的常见问题,欢迎大家评论区盖楼,盖楼有奖哦~

 

一、创建模型


Q:怎么判断应该创建那种模型?
A:图像分类 识别一张图中是否是某类物体/状态/场景。可以识别图片中主体单一的场景。
      物体检测: 在一张图包含多个物体的情况下,定制识别出每个物体的位置、数量、名称。可以识别图片中有多个主体的场景。
      根据业务场景可根据自行选择,或组合使用,如果不确定实际场景到底应该训练什么样的模型,建议加入官方QQ群(群号:185289236)联系群管解决。


Q:一个账号最多可以创建多少模型?
A:目前单个用户的每种模型类型最多可创建10个模型,每个模型均支持多次训练,若需要创建超过10个以上的模型,可以加入官方QQ群(群号:185289236)联系群管解决。


Q:在哪里可以看到我的模型?
A:模型创建成功后,可以在【我的模型】中看到刚刚创建的模型。

二、上传数据-图像分类

Q:训练图片有哪些格式要求?
A:目前支持图片类型为png、jpg、bmp、jpeg,图片大小限制在4M以内。长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px,一个模型的图片总量限制10万张图片。


Q:训练图片的采集有哪些注意事项?
A:①训练集图片需要和实际场景要识别的图片环境一致,举例:如果实际场景要识别的图片都是手机拍摄的,那训练的图片也需要同样的场景获得,而不要采用网上随便下载的图片;②考虑实际应用场景可能有的种种可能性,每个分类的图片需要覆盖实际场景里面可能有的可能性,如拍照角度、光线明暗的变化,训练集覆盖的场景越多,模型的泛化能力越强;③如果需要寻求第三方数据采集团队协助数据采集,可以加入官方QQ群(群号:185289236)联系群管咨询了解


Q:图像分类单个模型分类上限是多少?
A:目前图像分类单个模型分类上限是1000个,若超出这个量级可以加入QQ群(群号:185289236)联系群管解决。


Q:做图像分类模型,应该准备多少图片?
A:基于设计好的分类准备图片数据,每个分类需要准备20张以上,如果想要较好的效果,建议100张图片以上,如果某些分类的图片具有相似性,需要增加更多图片。


Q:图像分类数据上传出错为什么?
A:图像分类的数据上传方式非常简单,只需要将同一个分类的图片放在一个文件夹里,同时将所有文件夹压缩为**.zip格式**,直接上传即可。上传出错可能的原因有:①单个压缩包超限,目前单个压缩包限制大小为2G;②图片张数超限,目前图片张数上限10万张,若图片较多,建议分多个压缩包上传,若超出图片上限,请加入官方QQ群(群号:185289236)联系群管咨询解决;③文件夹/压缩包命名错误,分类的命名需要以数字、字母、下划线格式,目前不支持中文格式命名,同时注意不要存在空格。

三、上传/标注数据-物体检测


Q:如果训练图片场景无法全部覆盖实际场景要识别的图片,怎么办?
A:本身模型算法会有一定的泛化能力,如果要识别的主体在图片中占比较大,应该效果上问题不大;如果识别的主体在图片中占比较小,且实际环境很复杂无法覆盖全部的场景时,推荐用物体检测的模型来解决问题。(物体检测可以支持将要识别的主体从训练图片中框出的方式来标注,所以能适应更泛化的场景和环境)。


Q:做物体检测模型,应该准备多少图片?
A:基于设计好的标签准备图片数据,每种要识别出的标签在所有图片中出现总次数需要达到20-100次,如果某些标签的图片具有相似性,需要增加更多图片。


Q:物体检测模型进行标注时,有什么注意事项?
A:每张训练图片的想要识别的标签需要全部标出,不要有遗漏。


Q:物体检测功能线下标注好的图片可以直接上传训练吗?
A:若已经有标注好的图片,可以加入QQ群(群号:185289236)联系群管,根据工作人员要求提供数据,由工作人员协助导入。


Q:物体检测模型标签上限是多少?
A:标签上限为1000类


Q:物体检测至少需要上传多少图片?
A:物体检测1个模型至少需要4张图片,若少于4张会提示训练失败。


Q:数据标注 同一个数据集 可以多台电脑同时进行上传标注吗?
A:目前不支持,后续考虑将标注接口也开放出来,可以多端同时标注。若由于标注量较大,需要多人同时标注或需要数据服务商提供标注服务,可以加入QQ群(群号:185289236)联系群管解决。

四、训练模型并校验效果


Q:明明已经上传数据集,但训练过程显示无可用数据集是为什么?
A:模型训练要求模型类型与数据集类型一致,显示无可用数据集可能是模型类型与数据集类型不一致导致的。


Q:数据处理失败或者状态异常怎么办?
A:如是是图像分类模型上传处理失败,请先检查已上传的分类命名是否正确,是否存在中文命名、或者增加了空格;然后检查下数据图片量是否超过上限(10万张);再检查图片中是否有损坏。如果自查没有发现问题可以加入官方QQ群(群号:185289236)咨询解决。


Q:模型训练失败怎么办?
A:如果遇到模型训练失败的情况,请直接加入官方QQ群(群号:185289236)咨询解决。


Q:训练模型大概都需要多长时间?
A:训练时间与数据量大小有关,图像分类模型训练时间较短,1000张图片以内可以在30min内训练完成;物体检测训练时间较久,可能需要几个小时,请耐心等待。

五、上线模型获取API或离线SDK


Q:希望加急上线怎么处理?
A:加入官方QQ群(群号:185289236)咨询群管高优审核。


Q:接口上线后是否收费?
A:上线模型所有模型均可免费获得500次/天的调用限额。超过的部分采取分段阶梯定价模式,产品价格文档详情请移步https://ai.baidu.com/docs#/EasyDL_Price/top进行查看。


Q:申请发布模型审核不通过都是什么原因?
A:可能原因有,1、经过电话沟通当前模型存在一些问题或者不再使用,如训练数据异常、数据量不够、不想再继续使用等原因,沟通达成一致拒绝。2、电话未接通且模型效果较差,会直接拒绝。如果需要申诉,加入官方QQ群(群号:185289236)咨询群管解决。


Q:能否支持设备端本地计算?
A:可以,训练模型时注意勾选离线SDK,待模型训练成功,申请上线发布模型时即可申请发布离线SDK。经百度审核即可获取SDK包,以及SDK使用文档。


Q:目前都有哪些版本的离线SDK?对终端有什么要求?
A:图像分类模型生成的离线SDK: 目前仅支持Android系统且芯片为NPU类型的终端运行 目前芯片为NPU的主要移动端机型有:华为 荣耀V10、 mate10 、mate10pro、 p20、 p20pro 尚不支持非NPU芯片运行
物体检测模型生成的离线SDK: 支持Android及iOS两种操作系统 iOS支持8.0及以上版本,支持在armv7 、arm64离线运行 Android支持4.1及以上版本,支持在armeabi-v7a 、arm64-v8a开发板离线运行


Q:模型能否支持私有化部署?
A:模型发布后可以申请私有化部署,我们将与您电话联系确认应用场景,判断是否通过私有化部署的方式解决。


Q:离线SDK的请求数量也是限制的吗?
A:离线SDK可以实现无网环境的识别,因此不限制数量。


六、模型迭代


Q:模型效果怎么调优?
A:如果效果不满意先看下训练数据是否和实际场景要识别的图片一致,以及训练数据量是否太少。如果训练数据量已经达到一定丰富度,如单个分类/标签的图片量超过200张以上,效果仍然不佳,可以加入官方QQ群(群号:185289236)咨询群管解决。


Q:怎样根据模型评估报告优化模型?
A:模型评估报告中将针对模型给出整体评估建议,并给出不同标签mAP值,开发者可以根据不同标签的错误检测结果示例,查看漏标、错标示例,并根据错标漏标样本进行专项优化。


Q:模型上线后还可以继续进行优化么?
A:已经上线的模型依然可以持续优化,操作上还是按照标准流程在训练模型中选择要优化的模型和数据完成训练,然后在模型列表中更新线上服务,完成模型的优化。


Q:模型迭代后,接口地址是否需要重新申请?
A:如果模型已经是上线状态,依然支持模型迭代,只是需要在训练完毕后更新下线上服务接口,在接口地址不变的情况下可以持续优化效果。


Q:离线后需要增加新的分类、标签怎么办?
A:重新训练,申请上线发布,下载最新版SDK即可。

七、其他


Q:top1,top5准确率分别是什么意思?
A:top1:即对一个图片,如果概率最大的是正确答案,才认为正确;top5:即对一个图片,如果概率前五中包含正确答案,则认为正确。


Q:有没有调用easydl的示例代码?
A:社区中有多种语言的示例代码可以参考,详见:http://ai.baidu.com/forum/topic/list/190

 

EasyDL体验地址:http://ai.baidu.com/easydl/

训练过程有任何疑问,欢迎进行QA盖楼,或者随时联系我们:easydl@baidu.com

收藏
点赞
1
个赞
共11条回复 最后由cheeryoung79回复于2020-06-24 13:52
#12cheeryoung79回复于2020-06-24 13:52:08
#11 LY120209202145回复
遇到同款问题,请问解决了吗?

好像是对繁体字支持不行,换个简体的就导进去了。

0
#11LY120209202145回复于2020-04-17 02:27:49
#10 cheeryoung79回复
cheeryoung 7:21:38 为啥总导不进去呢?请大神指点! cheeryoung 7:22:32 lab_map.json { "SEG-B": 0, "SEG-I": 1, "O": 2 } cheeryoung 7:24:05 歐盟 對 土耳其 亮 綠燈 SEG-B SEG-I SEG-B SEG-B SEG-I SEG-I SEG-B SEG-B SEG-I 这是序列标注  
展开

遇到同款问题,请问解决了吗?

0
#10cheeryoung79回复于2020-03-22 07:27:54
#9 cheeryoung79回复
[图片]

cheeryoung 7:21:38
为啥总导不进去呢?请大神指点!

cheeryoung 7:22:32
lab_map.json
{
"SEG-B": 0,
"SEG-I": 1,
"O": 2
}

cheeryoung 7:24:05
歐盟 對 土耳其 亮 綠燈 SEG-B SEG-I SEG-B SEG-B SEG-I SEG-I SEG-B SEG-B SEG-I
这是序列标注

 

0
#9cheeryoung79回复于2020-03-22 07:27:31

0
#8wjhytt回复于2020-01-12 21:18:12

如何用摄像头拍摄图片,上传到EasyDL 的库中

0
#7小神与彼得潘回复于2019-02-02 22:33:41

手写的文本照片支持吗,要不要把电子版的txt上传呢,撩一下AI

0
#6pmuser回复于2019-01-07 11:53:38

基于设计好的分类准备图片数据,每个分类需要准备20张以上,如果想要较好的效果,建议100张图片以上

 

请问,如果我要对20款鼠标和10款键盘做检测识别,是不是要将每款鼠标和键盘都准备20张不同角度的照片,总计600张照片上传?

还是指我准备20张以上的包含不同款式的鼠标和20张以上的键盘图片就可以了?

谢谢

0
#5pmuser回复于2019-01-07 11:53:16

基于设计好的分类准备图片数据,每个分类需要准备20张以上,如果想要较好的效果,建议100张图片以上

 

请问,如果我要对20款鼠标和10款键盘做检测识别,是不是要将每款鼠标和键盘都准备20张不同角度的照片,总计600张照片上传?

还是指我准备20张以上的包含不同款式的鼠标和20张以上的键盘图片就可以了?

谢谢

0
#4hefeitest回复于2018-07-31 21:26:11

mark,很详细

0
#3紫星星公主回复于2018-07-30 14:59:43

mark住,并撩了你一下。

0
#2cuiwei0513回复于2018-07-20 10:30:42

Q:模型验证的时候上传图片竟然不支持BMP格式?

A:是的不支持。

0
TOP
切换版块