只要正确使用主办方提供的数据你就及格了
只要正确使用主办方提供的数据你就及格了
只要正确使用主办方提供的数据你就及格了
那怎么操作呢,仔细看看下面的详细操作步骤吧!
一. 下载数据
主办方提供数据在比赛官网astar2017.baidu.com的赛题详情(http://astar2017.baidu.com/index/event_details)如下图:(登录并报名后下载)
(1)train_data.zip解压后为训练数据
(2) scheam.zip解压后为意图/词槽定义说明
二. UNIT配置
进入UNIT(https://ai.baidu.com/unit/)
(1)新建场景
(2)按照schema说明定义意图和词槽
意图和词槽定义一定要和schema里的完全一致!完全一致!完全一致!不然打分系统不认
以movie_schema.xlsx为例,定义后如下图
以USER_MOVIE_TICKET意图为例,词槽定义后如下
(3)上传词槽词表
以movie_schema.xlsx为例,下图所示为词槽对于的词表
词表分别复制到以utf8为编码的文本文件中,如下图上传到对应的词槽中
三.上传训练样本
以电影场景的movie_train_data.xlsx为例
复制excel数据到UTF8编码的文本文件中,如下图
在UNIT平台的场景-数据中心上传样本集
四. 一键确认标注数据
因为主办方提供的数据是标注好的,上传数据后可以使用一键确认功能完成标注
如果一键确认后,标注进度中显示数量并非全部标注完,那么说明你定义的意图和槽位与主办方提供的不一致。要仔细确认了
五. 训练模型
完成以上操作后,开始训练模型
在场景--训练和验证页面,点击 训练并生效新模型
对话样本集勾选如上图,要选择你刚才上次的"训练数据",以及"闲聊负例样本(5000)"
六. 比赛打分
待沙盒环境状态为启动成功后,前往竞赛平台astar2017.baidu.com的个人中心-资格赛,选择UNIT场景并打分
是不是很容易呢!你离及格了只有30分钟,加油,祝取得好成绩。
为什么txt里面不能有中文?
不会吧
为啥我的训练数据只有46条有效。。。
及格是及格了,可还是100名开外
虽然搞了一天还是0分,决定继续接着再重新搞一遍
噢噢噢噢
然而并没有及格。。。
及格是不是就可以过初赛了,怎么考满分呢?