百度之星开发者大赛资格赛基础攻略
z00ux 发布于2017-08 浏览:3233 回复:8
1
收藏

只要正确使用主办方提供的数据你就及格了

只要正确使用主办方提供的数据你就及格了

只要正确使用主办方提供的数据你就及格了


那怎么操作呢,仔细看看下面的详细操作步骤吧!


一. 下载数据

主办方提供数据在比赛官网astar2017.baidu.com的赛题详情(http://astar2017.baidu.com/index/event_details)如下图:(登录并报名后下载)

(1train_data.zip解压后为训练数据

  

(2) scheam.zip解压后为意图/词槽定义说明

  


二. UNIT配置

进入UNIThttps://ai.baidu.com/unit/

(1)新建场景

(2)按照schema说明定义意图和词槽

   意图和词槽定义一定要和schema里的完全一致!完全一致!完全一致!不然打分系统不认

   movie_schema.xlsx为例,定义后如下图




USER_MOVIE_TICKET意图为例,词槽定义后如下



3)上传词槽词表

      movie_schema.xlsx为例,下图所示为词槽对于的词表


词表分别复制到以utf8为编码的文本文件中,如下图上传到对应的词槽中



三.上传训练样本

  以电影场景的movie_train_data.xlsx为例

 复制excel数据到UTF8编码的文本文件中,如下图



UNIT平台的场景-数据中心上传样本集



四. 一键确认标注数据

   因为主办方提供的数据是标注好的,上传数据后可以使用一键确认功能完成标注


如果一键确认后,标注进度中显示数量并非全部标注完,那么说明你定义的意图和槽位与主办方提供的不一致。要仔细确认了


五. 训练模型

  完成以上操作后,开始训练模型

  在场景--训练和验证页面,点击 训练并生效新模型


对话样本集勾选如上图,要选择你刚才上次的"训练数据",以及"闲聊负例样本(5000)"


六. 比赛打分

   待沙盒环境状态为启动成功后,前往竞赛平台astar2017.baidu.com的个人中心-资格赛,选择UNIT场景并打分


是不是很容易呢!你离及格了只有30分钟,加油,祝取得好成绩。


收藏
点赞
1
个赞
共8条回复 最后由无量闪电回复于2017-08
#9无量闪电回复于2017-08

为什么txt里面不能有中文?

0
#8用户已被禁言回复于2017-08
#6 king天狭鬼回复
及格是及格了,可还是100名开外

不会吧

0
#71324457514回复于2017-08

为啥我的训练数据只有46条有效。。。


0
#6king天狭鬼回复于2017-08

及格是及格了,可还是100名开外

0
#5爱在天涯csj回复于2017-08

虽然搞了一天还是0分,决定继续接着再重新搞一遍

0
#4用户已被禁言回复于2017-08
#2 qizhenyong77回复
及格是不是就可以过初赛了,怎么考满分呢?

噢噢噢噢

0
#3请叫我邹小敏回复于2017-08

然而并没有及格。。。

0
#2qizhenyong77回复于2017-08

及格是不是就可以过初赛了,怎么考满分呢?

0
TOP
切换版块