核心诉求
随着传统分类学研究日趋没落,分类学专家越来越少,但是还有大量的动植物标本、照片需要快速的鉴定和识别;同时野外博物教育逐渐兴起,需要能够快速识别物种并提供相关知识的平台和工具。百度EasyDL定制化训练和服务平台的出现及其优异的分类性能为生物分类研究和生物科普带来契机。因此生物记向百度AI开放平台提出诉求,申请训练野生动物(以鸟类为例)模型,并逐步迭代优化,以解决快速识别物种的迫切需求,支持科学考察与科学普及活动。
解决方案
首先我们收集整理野外鸟类生态图片20万幅,经过分类学专家标注筛选,最终选出12万幅,覆盖700多个中国鸟类物种。通过使用百度EasyDL定制化图像识别进行训练,先后进行雀形目鸟类模型、非雀形目鸟类模型及700多种鸟类模型训练,并进行逐步优化。
目前700多种鸟类模型top5准确率达到95.7%,非雀形目鸟类模型top5准确率达到95.79%,满足上线服务要求。在生物记中,物种智能识别工具与分类专家的专业知识相结合,大大提高物种识别的效率和可靠性。具体流程如下:
第一步:用户进行野外观测,通过相机或手机对野生动物进行拍照;
第二步:用户通过登录生物记官网(http://nol.especies.cn),上传观测记录及相关照片;
第三步:用户提交照片时调用百度的图像审核接口,做初步判断为合规照片;
第四步:生物记将通过图像审核的图片提交到百度EasyDL模型API接口,并返回识别结果;
第五步:用户可以选择合适的识别结果,获取物种的名称,或者选择无正确结果;
第六步:无正确识别结果的图片将提交到物种鉴定平台中,由分类专家进行鉴定;
第七步:获取的图片及物种位置信息将服务于“地球大数据科学工程”中的物种多样性信息平台。
下面是上方提到的主要流程示例图:
用户在野外观测并清晰拍摄生物照片
用户在生物记网站提交新建的野外观测记录
用户上传观测者记录的照片
网站调用百度EasyDL的API接口进行定制化图像识别
用户提交的生物数据还将服务于物种多样性的信息平台