sys_time识别范围及系统槽位归一化格式说明
陆仁贾wzl 发布于2017-12-29 浏览:3498 回复:6
2
收藏
最后编辑于2018-12-27

UNIT系统槽位说明:http://ai.baidu.com/forum/topic/show/492606

一、sys_time时间槽位的识别范围包括(括号内为归一化结果):

1、日期
如:明天(2017-12-3)、下周三(2018-01-03)、15号(2017-12-15)、十月8日(2017-10-08)、2018-10-10(2018-10-10)
2、时间点
如:下午2点(14:00:00)、三点半(03:30:00)、晚上(18:00:00)
3、日期+时间
如:明天上午8点四十(2017-12-30|08:40:00)、周六早上(2017-12-30|07:00:00)
4、节假日(默认给今年的阳历日期)
如:国庆(2017-10-01)、元旦(2017-01-01)、五一劳动节(2017-05-01)、重阳节(2017-10-28)、明年春节(2018-02-16)

 

二、系统槽位归一化格式如下(三列分别为词槽内容、归一化结果、格式说明):

1、sys_time槽位

用户各种表达词语 归一化结果 说明
8月7号 2017-08-07 没有指明年份,默认当年
7号 2017-08-07 没有指明年月,默认当年当月
下午三点 15:00:00 只有时间点,不会默认日期
上午 09:00:00 “早上”、“上午”、“中午”、“下午”、“晚上”、“凌晨”的归一化结果分别为“07:00:00”、“09:00:00”、“12:00:00”、“14:00:00”、“18:00:00”、“01:00:00”
明天下午三点 2017-12-29|15:00:00 日期和时间以“|”分割
8月 2017-08-00 没有指明几号,归一化给00
2018年 2018-00-00 没有指明几月几号,归一化给00-00

 

2、sys_time_interval槽位(时间区间)

用户各种表达词语 归一化结果 说明
周二到周五 2017-12-26~2017-12-29 “~”为时间区间的连接符号
今天下午到明天上午 2017-12-28|14:00:00~2017-12-29|09:00:00 “~”为时间区间的连接符号
16到18号 2017-12-16~2017-12-18 没指定年月,默认给当年当月

  
 3、sys_unit槽位

第三集                3.000000|集                    数字和单位以“|”分割
一公里                1000.000000|米                 
一百块                100.000000|元                  
一百亩	             66666.666600|平方米
3星期	             21.000000|天
一分50秒              110.000000|秒
两钟头                 2.000000|小时

4、sys_loc槽位

西二旗           (NERL_PLUS_LOC_ROOT)>(北京市)>(海淀区)>西二旗              归一化结果里说明了地址的层级关系
顺义             (NERL_PLUS_LOC_ROOT)>(北京市)>顺义区        
北戴河	        (NERL_PLUS_LOC_ROOT)>(河北省)>(秦皇岛市)>北戴河区
收藏
点赞
2
个赞
共6条回复 最后由nuomitob编辑于2018-12-27
#8nuomitob回复于2018-03-16

希望 sys_time_interval 能够支持"这两天", "最近x天" 这样的归一化

0
#6daipeng_hi回复于2018-01-04

说实话,没看明白;

0
#5静心之王回复于2018-01-02

学习了!

0
#4shoranxfyzhy回复于2017-12-30

好帖,支持支持

0
#3goJhou回复于2017-12-30

这贴?怎么似曾相识。我记得我回复过呀- -

0
#2伊茨米可回复于2017-12-30

官方文档!支持!

0
TOP
切换版块