课程实录-EasyData智能云秤一站式数据管理
May的山楂木 发布于2020-05-22 10:16 浏览:373 回复:5
1
收藏
最后编辑于2020-05-25

主题:EasyData助力智能云秤一站式数据管理

时间:2020年5月21(线上)

讲师:百度AI开发平台部高级研发工程师 林克

 

主持人:本次课程的内容是由百度AI开发平台部高级研发工程师林克,带来EasyData助力智能云秤一站式数据管理的课程,同时会为我们演示智能云秤水果采集、训练及识别的操作,我们欢迎林克老师。

大家晚上好,我是来自百度AI开发部的林克,今天带来的课程是EasyData助力智能云秤一站式数据处理,主要面对深度学习感兴趣,以及关注行业场景阐述一站式解决方案的人群。

今天主题分为两部分,首先我介绍一下EasyData智能数据服务平台,之后会结合智能云秤的案例演示一下接入数据的训练到部署的流程。EasyData智能数据服务平台是一个提供数据采集、标注、清洗、加工等一站式数据智能服务,助力开发者高效获取AI开发所需高质量数据的平台,4月份刚刚上线。

下面看一下它大概的结构,首先说一下为什么要推出EasyData这款产品。主要有三点,大家可能都知道,AI=数据+算法+算力,百度EasyData一站式开发平台在算法和算力和部署上做了很多工作,有EasyData经典版和专业版,虽然支持了部分数据的功能,像现在一些数据已经上传,但是不是很系统,所以我们针对数据进行了梳理,推出了EasyData智能数据服务平台。其次在实际AI开发过程中,用户反映了各种各样的问题,如数据采集硬件如何使用的问题,数据如何同步,数据如何导出。根据我们统计大概96%的用户在数据生产环节都会遇到这样那样的问题,所以需要EasyData来帮助用户尽量低成本一站式完成数据的生产

这是EasyData的整体业务架构图,在数据采集、数据扩充、数据清洗、数据标注、数据管理分析等数据生产过程中做了比较专业规范的工作,而且会在这些方向上持续提供能够给用户解决实际问题的功能。比如数据采集的设备,比如你电脑上插上USB摄像头,就可以使用EasyData提供的采集管理软件,快速将摄像头采集的数据接入到EasyData,整个过程中不需要任何的处理代码,而数据标注侧EasyData提供了智能标注以及即将推出的多人标注提升用户标注的效率,降低标注成本。传统的数据生产方式,如果涉及到数据采集的话,在硬件选型和硬件调试上会花很长时间,有些甚至到了模型迭代环节发现精度不够,再重新进行硬件的替换。数据获取和数据清洗环节需要写代码从硬件设备上进行数据获取,如视频流抽帧,不同的硬件码流可能会不同,RTSP协议地址可能不一样,不同的操作系统可能会有兼容性问题需要解决等等。清洗环节也需要手动完成数据清洗,如一些简单的数据清洗还好一点,如果图片模糊相似这种,需要更大的力气花一番时间调研和开发,而在EasyData上我们首先向用户灌输在数据生产环节需要近来专业规范操作,专业化的数据生产,加上科学的深度学习算法以及可接受的算力成本,才可以训练出实际解决场景的模型。在实际生产数据环节,EasyData帮用户做了线下很多琐碎的工作,如硬件选型和调试,EasyData推出软硬一体方案,在EasyData下载软件,安装即可使用,数据清洗环节,后续会推出更多的功能。目前也已经支持智能标注,并且提供了单人在线标注和多人标注,后续会上线多人智能标注,EasyData让AI更简单,更专业。

刚才说到了EasyData的智能化的特点,体现在采集、清洗、标注、扩充闭环等环节,如在数据采集环节EasyData提供了软硬一体方案,目前设计是提供单路直连和直路间接连接,可以在EasyData下载对应的软件进行使用,针对多路摄像头进行控制,通过视频流抽帧方式,将数据同步到EasyData,单路也会在近期推出。当硬件准备好以后,可以持续采集数小时将数据采集到云端,然后进行存储的管理。

数据清洗和扩充环节,这边有两个实例说明一下数据清和效率的提升。第一,上面的图片是我们做的智能生猪盘点的示例,初级功能是对猪的识别和数量的检测,猪厂数据接入EasyData以后,由于场景的特殊性,睡觉的猪很久不移动,所以以一个固定频率采集数据,相似度非常高,这个数据用来训练不是那么有效率。这里就可以用到EasyData的去相似的功能,将相似的图片去掉,留下确实有价值的数据,同时用户的需求是以猪栏为维度统计猪的数量,可以看到原始图片上,猪栏两侧还有其他猪栏的猪,EasyData提供了对图片裁剪的功能,自动将图片进行处理,清洗和裁剪可以将人力减少80%。下面是一个数据扩充的示例,商品SKU数据采集成本比较高,当SKU数据不足情况下,可以将少量的SKU数据通过排列组合方式进行扩充,然后参加训练,经过测试对比,大概只需要提供10%的数据,就可以完成和全量数据参与训练的效果数据,需求下降了90%

智能化还体现了标注环节,EasyData提供了智能标注的功能,针对图像数据只需要标注大约30%,就可以使模型效果和全量数据效果模型一致。大概原理就是先标注少量数据,然后智能标注再进行模型的预训练,训练完以后会有一些不确定的示例再次确定,需要用户参与确认,经过几轮迭代,模型的准确率就会变高,智能标注就会完成标注,整体可以减少70%的标注量。

最后讲一下大家都比较关心的数据安全,数据安全这个点在EasyData设计之初就已经考虑到了,全流程环节中保证了数据的安全,如采集端的数据鉴权,加密输出后续EasyData会考虑引入联邦学习的方式,做到数据不出安全区而用于深度学习的模型训练。

第一部分对于EasyData的介绍我已经简单快速地介绍了,下面开始我们结合EasyData对一个果蔬识别模型训练和部署实战的演示。这个例子是中科立业智能云秤结合AI的EasyData快速落地,使用EasyData进行数据生产,模型训练,然后将模型功能用到智能云秤上,目前识别出50种水果,识别率达到95%以上,随着对模型继续迭代,准确率还可以继续提升。

 

首先我们需要一个创意,受到新冠肺炎的影响,为了减少人员接触,能否在购买水果蔬菜时候避免人员接触,考虑到人们购买水果蔬菜种类不一样,不能像超市一样扫码结算,针对图像和称重识别出哪种水果,然后计算出水果的单价,最后生成支付的二维码。这几幅图是场景上经常用的图,有一些问题,首先样本不均匀,因为我们买的水果是几类比较多,有一些偏门的水果数据量不多,可能造成数据训练时候有一些标签不是非常准,数据量多的水果训练效果好一些,这里可以用到数据增强的功能。第二个问题,可以看到图片上有一些水果是被塑料袋包裹的,因为结算时候可能把塑料袋直接去秤,我们需要对包裹水果的识别率。还有一个问题,有些水果它是一个拉类,比如橙子、橘子、葡萄,可能彼此之间非常相似,这也需要一些数据增强,以及对数据的调整,达到训练的效果。还有一些光线的问题,这里对规范化数据的建议,像这种场景,我们总结出来数据输入方,就是单图单标签,单类单个结算,另外两种场景就是提供的数据训练一个是带包装盒的,另外一个是带塑料袋的,这就是数据生产的规范化。

这个图展示了从硬件到准备部署的全流程。首先准备一个秤和摄像头,访问EasyData入口,一直到最后的模型部署的训练。接下来会走到实操的环节,我会在页面上给大家演示一下整个EasyData的数据接入到训练部署的流程。

首先可以看到现场有一个摄像头,大家可以看到,现场有一个摄像头,前面放了一个水果,这就是云秤的原型,前面放了一袋樱桃,我切到云秤下面摄像头的视角,大概是这样的视角。一会连接到这个摄像头,下载SDK采集数据。首先打开页面,输入网址,在上面找到开发平台,最右侧的EasyData智能数据服务平台,点击进入,也可以直接输入链接来到它的地址,点击立即使用。

现在可以看到,这是EasyData的管理平台,左侧是功能,几大块数据总览,下面是标注,有在线标注,智能标注,还有标注的支持,如果你是标注的新手,可以提交给我们寻求一些支持。这块是摄像头采集图片,也就是一会要做的,在这里下载SDK把我们的摄像头部署好,还有一个云服务获取数据,这个最后再讲。最下方是清洗任务的管理。

首先我们点击摄像头管理,这边有一个下载本地软件,点击下载,我事先准备好了一个下载好的版本,在这里,先解压。之后进入文件夹,有三个压缩包,针对不同平台的SDK,有Windows,LINUX和ARM三种,这三种系统都可以支持。今天使用的电脑是Windows系统,所以解压Windows的。双击运行,可以看到已经运行成功了。现在我们到页面上,看到这样的页面,需要数科一个AK、SK,这个可以在EasyData获取,我们转到EasyData的页面,到右上方账号下面有一个AK、SK,点击查看,然后复制,然后进行登录。登录后看到这样一个页面,可以添加本地的USB设备,这里选择视频抽帧接入,设备名称我们叫追过,选择连接上面的摄像头,这个是USB的,我们选择它。点击下一步,获取图像,这个图像已经预览在了校验这一步,可以看到已经成功的可以获取到这个图像了,然后我们再点击下一步。

这个界面是一个设置,上面的部分是支持修改抽帧频率,有秒、分钟和小时,如果设置1就是1秒钟抽帧一次,我们先设置5秒,下方是运行时间,比如之前说的生猪监测,可以根据猪的活动时间设置。在设置之后可以提交,提交之后发现下方多了一个设备管理,有本地运行状态和网络状态,这里有一个按钮,是否控制抽帧上传数据的按钮,这里点击可以查看抽帧,我们再点击查看云端数据。在这里会发现原始数据查看,摄像头管理,选它,这里是时间筛选,默认到今天为止,可以看到每5秒频率截到这么多张图。然后点击保存数据集,我们也可以从数据总览中创建一个数据集,这个场景是一个图像分类的单独的标签,所以都是默认的,基本上不需要修改什么,点击完成。

这边多了一个刚创建的数据集,可以看到它数据量现在是0,标注状态也是0,我们现在可以选择导入数据。我们有这几种方式可以选择,本地数据集,你可以本地直接上传图片或者解压缩包,这是一种本地的上传模式。第二是线上也有数据集,你可能在EasyData上创建了多个数据集,因为备份或其他原因,可以在几个数据集之间互相导入。第三是导入摄像头采集的数据,就是刚才通过摄像头抽帧的图片,可以从这里导入。第四是从云服务调取数据,这个涉及到数据闭环的部分,这个最后会讲,这里选择从导入摄像头采集数据,这边会跳到摄像头管理这边,然后点击保存到数据集,版本是V1,这里可以选择成功选择保存,删除原始数据,我们不需要删除,直接确认

回到数据总览,看到导入了大概32张图,然后我们可以查看一下。这是刚才摄像头拍的图片,因为没有动过,大概都是一样的,这个时候就表示导入完成,回到数据总览,接下来进行清洗,可以点击清洗任务管理,清洗任务,选择V1,清洗可以选择一个数据集,清洗后会存到你选择的新的数据集,可能会覆盖这里的数据,版本默认选V1,会替换原有的V1的数据,所以我们选择V2,清洗以后会生成一份新的数据到V2里。下面看几个清洗的选项,同时支持三种清洗方式,首先最上面进项比较简单,就是你有几个选项,水平、垂直、翻转,上面可以选择角度,还有裁剪,裁剪我们不需要很大的范围,所以可以选择裁剪的范围。如果需要这么大的话,只需要裁剪这么多,点击保存。

下面是一个去模糊,下面可以看到,有5张图片,下面有对应的清晰度,5一直到500,500度以上就比较高了,我们选择的阈值是0到10000,平时我们可以设置小一点,400度就差不多了,如果你对清晰度有要求,可以设置到很高的值,如果清洗后发现阈值设置高了,可以回到上面,如果用了新版本,老数据是会保留的,重新设定一个阈值,这里我们设置300度就可以了,然后保存。最上面去近似的功能,也是给了5张图片,从左到右,相似度越来越低,最左边两张图相似度是0.75,前3张图到0.5都是非常相似的,所以说这里的阈值是说,相似度大于这个值的时候只保留1张,这里设置0.75就可以了,然后提交清洗。这里有一个任务正在清洗中,清洗方式是这三个。可以查看任务详情,查看开始时间。

下面用一个备用的数据集,可以看一下标注的功能,这边有一个备用的数据集,点击标注,现在没有标注的图还有1张及大概是橘子,这是已经标注的数据,我添加搜索标签,因为这是一个橘子,标签搜橘子,有这个标签就点击OK,标注结果是橘子,点下一步,自动保存,现在所有都已经标注完成,我们可以回到数据总览。到这一步是EasyData的完成了,下面是EasyDL,这里选择一个专业版。

这里选一个创建项目,水果,这里一个单独的按标签分类,网页调参,这边是要多一些功能描述,然后点创建项目。我们可以看到多了一个训练的项目,这里新建任务,第一个部分是选择数据集,刚才是这个部分的数据集,下面可以看到有很多标签,可以点击根目录右边的加好,把目录全部添加到上面,然后确定。下面可以看到,这里是一个评测,如果有多余的数据集进行评测,可以点击这里,今天并没有准备好评测的部分,这两个部分是预训练模型,左边的模型是大规模数据集的预训练模型,效果会好一点,但是支持的网络少一些。右边支持的网络多一些,但是数据集训练效果差一点。如何选择网络的话,在右侧的按钮有。一般来说ResNet就可以覆盖大部分的场景。这里三个GPU的选择,默认是P4,有100小时的免费时间,性能和价格都不同,然后提交训练任务,这边已经开始了。

可以看到,这边会标注训练进度,你可以勾选完成后提醒你的手机短信,训练完成就会直接给你手机发送短信提示,训练完成了。由于时间关系,我们不再对这个训练等待了,我们还是打开之前训练好的模型。可以查看一下这个效果,也是这个水果模型,用了5000张图片,可以看一下效果,这不是非常大的规模,但是训练效果已经相当好了,因为数据是规范的原因,EasyData接入的数据就是标准,以及质量经过清洗后的,质量很高,没有用很大的数据量,当然后面还可以提升,现在准确率是99.6%。

然后回到训练任务,可以检验一下效果,本地今天放了两个图,有一个葡萄的图,检验一下。现在可以看到,检测出这个葡萄,并且检测出了具体的子分类,预测出是99.95%,非常好。另一个换橙子,检测出了橙子,是赣南脐橙,99.96%。

 

 

接下来再演示一下模型训练完成之后部署,再用另外一个数据集,因为刚才这个模型已经部署过了,我们用另外一个训练出来的模型部署一下。点击部署,可以选择部署方式,我们选择公有云API,可以取一个服务名称,需要补充接口地址,这个应该是位置的。这个时候点击开始部署,确定。提交申请了,可以看到这个模型正在发布中,可以看一下之前部署的几个模型,发布完以后就会生成这样的API,之后再到控制台创建一个APP,赋权后就可以使用这个API了。

然后这边先到控制台上去,这里可以看到EasyData的控制台,下面就是已经训练部署好模型的API,有这几个,刚才那个还没有训练好。可以点击这里,这里是创建应用,可以看到现在已经有了几个应用。创建应用的时候,你会发现刚刚训练好的模型已经被勾选上了,这里我们输入应用名称就可以。创建完毕,返还应用列表,多了一个应用,下面有API Key和Secret Key,用于访问接口的token,我们用这个token访问我们的接口,下面我给大家演示一下事先已经准备好的接口。

可以看到,有一个DEMO图像,就是甘蓝脐橙的图像,还有一个DEMO的python文件,这个比较简单,大概意思就是获取token,读到这个文件,访问到我们的接口,然后获取到它的标签,置信度靠前的标签数据。可以看到这有一个返回,result给出了置信度前五个标签,甘蓝脐橙,置信度是99.96%。

回到我们的EasyData页面,到云服务授权这里,这里可以添加云服务授权,就是刚刚发布的一些新的接口,可以添加这些接口的授权,添加完以后就可以在云端获取调用这个接口所有的图片。现在可以看到调用这四个接口图片,这有一些延时,然后点击原始数据查看,之前的接口我调用过,我们可以看一下。勾选水果识别,专业版,时间可以拉长一点,从9号开始,可以看到已经加载出来了,标签选一个之前获取过的,甘蓝脐橙的标签,因为网络原因有点慢,这个图是我们以前测试过的,调用过这个API我们会进行展示。有这个功能,这边可以筛选,并且重新保存到数据集,利用数据闭环的功能,可以发布完模型API以后,如果有调用,可以不断完善数据的精度,就是数据可以不断的接进来。

下面回到PPT,先放一个视频,这个是我们模型部署好以后的效果。

今天演示环节大概就到这里,下面QA环节

 

Q:都支持什么摄像头?

A:摄像头没有什么,门槛比较低,USB能够连接的都支持。

 

Q:去模糊的功能上,清晰度是怎么得出来的?

A:清晰度关于图片去模糊的阈值,openCV库基于拉普拉斯算子有一个方法,可以通过它做卷积运算计算出图片边缘的方差,计算出标准差,我们知道图片有比较高的方差,就有比较广的评奖范围,方差比较广表示是比较正常的图片,如果方差小的话,边缘数很小,我们依据这个判断这个图片就比较模糊,如果是正常摄像头拍摄的,不对聚焦进行处理,正常的摄像头拍摄的图一般是满足这个规律,如果你用相机拍摄比较模糊的图片,比如前面清楚,背景模糊的图是不适用这个原理,但是正常来说,实用场景的摄像头基本上拍出的图片可以用这个方法去模糊。

 

Q:边缘设备需要怎么部署?

A:边缘设备指的是什么,一般来说有摄像头可以接入到开发版或机器采集图片,我们的SDK可以支持主流的系统。

 

Q:EasyData一般用在什么场景比较多?

A:对于我们不需要做很多数据处理的开发的场景,需要标准化数据采集,尽量减少开发,尽快提高模型效果的场景,比如刚才说的生猪的模型场景,一些植物的场景,一些水果的场景。其实用途很广,超市货架可以用,因为我们支持图像分类很多,有图像分类和物体检测等等很多训练的方式,一般来说现在摄像头采集数据比较方便,这样就可以采集数据的场景,接入摄像头数据的场景都是比较合适的。

 

Q:生猪识别是识别什么,是种类、数量还是状态?

A:可以做的很多,最基本的需求是识别数量,最后你可以慢慢往后拓展,如果是视频流的话,可以针对它的轨迹进行识别,因为你可以把视频流拆成很多帧,对轨迹和标号进行识别,根据这些数据可以训练不同的模型,比如是不是在吃东西或者睡觉,是不是运动量过少,生病之类的。种类的话,其实数据训练量过大的话,我理解这也是可以做到的。

 

Q:了解。另外有同学问,像刚才讲到云秤的水果识别是用图片分类还是物体检测比较好?

A:水果识别这种,根据我们现在这个场景,一般来说超市结算一次性只会摆一种水果结算,单图单标签是最好因为一个图片里不会出现多个水果,所以还是图像分类这种单图单单标签比较适合。物体检测适合更复杂一点场景,比如需要检测这个图片有多少个水果,如果是混合不同水果类型和数量,都要识别出来的话,可以用物体检测。

 

Q:现在水果识别可以做到离线吗?

A:我们支持离线部署,EasyEdge就是离线的SDK部署。

 

Q:咱们的数据现在可以下载到安卓进行离线运行吗?

A:数据集还是需要导入EasyData,训练是在EasyData和EasyDL上做,训练好的模型可以部署在设备上,可以离线部署。

 

Q:有同学问,标注好的数据能不能下载到本地?

A:可以,我们有数据导出的功能,我们支持,以及我们标注好的数据也可以直接带着标注信息导入到数据集,这样比较方便,如果有一批数据想导入到数据集,连着标注好的数据也可以,可以直接进行训练。

 

Q:有同学问EasyData是只针对图像数据吗,像视频、文字是不是也可以处理?

A:对,支持,但是不是通过摄像头采集,这个可能是通过数据上传,比如支持文件的直接上传以及数据集直接导入,以及数据闭环的数据回收,除了摄像头导入之外,这三种数据上传方式都可以,不限制是不是图片,当然可能没有摄像头采集这么方便。

 

Q:有小伙伴问,比如到后期水果种类增加的话咱们怎么做?

A:因为有数据闭环这个功能,一开始数据集只是训练了50种水果,后期使用场景发现更多的水果,因为这个模型已经部署了,在数据闭环里会采集并筛选,可以在EasyData获取到我们后来训练到的新数据,可以把这些数据导入到数据集重新进行标注,然后进行迭代训练,可以不断提高标签的广度和训练的精度,因为我们是支持不断的再训练,就是数据训练再训练回收的过程。

 

Q:这个摄像头接规定的设备才能完成吗?您讲一下摄像头的数据怎么接入EasyData里吧。

A:好的,现在摄像头就是一个视频抽帧的形式,然后加密传输到EasyData,这个场景是需要网络的,SDK是支持LINUX、Windows、ARM,ARM开发板,这是一种情况,主流的还是Windows和LINUX比较多,这两种情况你需要有这样的系统连接摄像头,有一个设备,然后需要有网络,才可以把数据上传到EasyData。

 

Q:好。看一下还有什么其他的问题。有同学问单图多标签清洗和单图单标签的是一样吗?

A:不一样,可能训练之初目的就不一样,单图单标签就是一个图里放多种水果,必须全部都能识别出来,这个场景更简单一点,模型效果也更高,单图多标签也是可以做,复杂度可能高一些。

 

Q:好。物体识别图片分类,我理解应该说是物体检测和图像分类的时延性的区别?

A:时延性的区别是指模型API反映效率吗,还是要具体看模型自身的效果。

 

Q:咱们视频流可以接在EasyData里做吗?

A:在我们最近只接受抽帧,后面有计划接受视频流的数据。

 

Q:只能接一个摄像头吗,可以不可以接多个设备?

A:可以接入多个设备。可以在摄像头管理可以看到,这下面支持多个摄像头,可以在这里多个勾选,我们是支持多摄像头的。

 

Q:所以每个摄像头上传上来的数据会单独存在那个摄像头的标签下吗?

A:对,可以根据摄像头的粒度筛选所需要的图片,不是混合存储的。

 

Q:好的。有人问,水果识别支持智能标注吗?

A:我们单图单标签不太适合智能标注,刚才的标注过程就是一张图我们之直接点选标签,就是标注完成了,这个场景暂时不支持智能标注,但是我们的物体检测是支持的,我们之前生猪的案例是支持智能标注的,这个情况下可以节省人力,你可以搜集一轮数据以后再开始,数据比较多的情况下再标注,比没有智能标注的情况下要快不少。

 

Q:如果是使用笔记本自带的摄像头需要如何添加设备呢?

A:刚才可以看到这里添加设备的时候,这里可以选择设备,笔记本的设备如果开启的话,可以选择到的,也是都可以添加的。

 

主持人:好的,可以看到很多路径。

A:对,我这上面是额外接了两个摄像头,这都可以选择。

 

Q:了解,复杂场景的目标可以检测吗?

A:具体指的是什么呢?

主持人:这个同学也没有详细讲,可以在弹幕区补充一下复杂场景具体指的是什么?比如多个水果还是说有什么具体的应用场景呢?还有什么其他的问题,我看看群里有没有提问。

 

Q:有同学问比如大雾、雾霾这种可不可以做检测,可以看出来吗?

A:图像的识别,如果给出比较标准的场景,比如背景差不多的地方可以做一下训练。

 

Q:这是刚才复杂场景说比较背景比较复杂,比如水果后面有水果海报,比如场景是一个复杂的背景,可能要检测复杂背景中的一个物体,这个可以做到吗?

A:也可以,生猪那个案例可以,猪的情况有的时候会互相遮挡,挤在一块,导致识别过程中不是很准确,其实到后面我们模型训练完以后,猪栏的情况就是有一些栏杆的遮挡,猪互相之间的遮挡,后来训练出模型效果还可以,对于稍微复杂的场景也是可以做的,如果觉得场景比较复杂的话,可以咨询我们的研发同学,我可以提供一些帮助。

 

Q:明白,还有像复杂背景下的小物体检测,我理解是不是和如何标注也是有一定的关系?

A:对,有些场景下,本身标注就比较困难,这时候可以用一些智能标注的功能。

 

Q:明白,有同学问在离线版本下,种类增加的话要怎么做呢?

A:还是需要把数据反馈回EasyData上进行重新训练。

 

Q:看到有同学问,工地上检测有没有戴安全帽时要用什么样的方案?

A:这个我理解应该是单图单标签可以尝试跑一下。

 

主持人:了解,这也是通过视频的形式,把监测的视频接入过来。

 

A:要看一下实际的场景,比如在入口补一个摄像头,每次一人一过这样的,这样的单图单标签应该可以,但是如果场景比较复杂,人很多,一起进出,这种情况下物体检测会好一点。

 

Q:有同学说在复杂背景下智能标注错误率比较高,怎么避免呢?

A:智能标注错误率比较高,说明这个模型预训练效果不是很好,因为智能标注本身原理就是对已经提交标注的图片进行预训练,这个效果不好你可以从几个角度上找原因,第一就是这个数据规范的程度,是不是比较规范的数据,适合训练的数据。第二就是训练的方式,比如有没有选对分类。第三个,如果这两个排除没有问题的话,可能是需要加大一些训练量。当然如果效果实在不好,可能需要一些专业化介入,需要找到我们的研发同学。

 

主持人:了解。我补充一下,大家如果想找研发同学解决问题,可以从页面上直接提交工单,由后台研发同学给大家解决相应的问题。

 

Q:部署到本地以后,摄像头分析物体和API相比怎么样?

A:会比API快一些,节省了请求本身的网络时间开销,具体还是依赖于设备本身的性能。

 

Q:智能云秤这个设备大概什么性能?

A:现在使用场景来看要求不是很高,刚才放的视频里可以看到,识别的速度还算可以。

 

主持人:确实还是挺快的,在日常使用时候可以满足。

A:对,可能稍微有一些延时,因为模型还是在初步阶段,日常使用已经没有问题了。

 

主持人:好,现在问题也就这些,今天QA环节就到这里结束。

 

主持人:再给大家介绍一下软硬一体方案的优惠政策,只要现在购买任何EasyDL和百度自研硬件的方案,在5月13—6月13日之间购买任意EasyDL软硬一体方案将获得专业版脚本调参等价训练时长。比如购买一套EasyDL-VMX加速卡软硬一体方案,699元,可获得软硬一体方案一套+专业版脚本调参26小时GPU-V100训练时长/32小时GPU-P40训练时长/41小时GPU-P4训练时长(任选一种)。扫描左侧二维码可以到百度AI市场中,了解更多的软硬一体方案的介绍。

本次课后作业:使用EasyDL专业版 图像分类/物体检测模型训练检测模型脚本调参/NoteBook方式,有一个参考训练数据下载地址。提交扫描屏幕二维码提交作业,我们有最佳布道师的奖品,参与有奖评选。

大家还可以读书笔记 、使用心得、使用教程、场景方案介绍等文章,在活动贴留言,参加优秀文章有奖评选,可以扫描屏幕下方的二维码。

后面的课程安排,5月22日晚上7点到8点,讲的内容是电力AI巡检应用分析,实践是电缆输电通道挖掘机侵入识别演示。5月23日的内容是基于AR与EasyDL的地下资源管理方案,大家可以看一下右边的视频,这个就是利用EasyDL来做的,我们看一下水务行业日常设备巡检方案展示及APP内模型部署

今天直播课就到这里,大家可以扫描右侧二维码添加小助手的微信,就可以进入到直播群了,感谢大家的参与。也感谢林老师给大家带来的分享。

收藏
点赞
1
个赞
共5条回复 最后由何必固執回复于2020-05-25 08:56
#6何必固執回复于2020-05-25 08:56:46

Z这也太详细了吧

0
#5rose20135188回复于2020-05-25 08:14:25

好可惜,错过了

0
#4wildwood10回复于2020-05-23 15:24:40

讲的清晰

0
#376876743h回复于2020-05-23 07:40:08

棒!

 

0
#2付洋洋carrie回复于2020-05-22 15:14:24

好赞

 

0
TOP
切换版块