ERNIE-IE 2.0
更新时间:2022-01-28
ERNIE0-IE 2.0
简介
- ERNIE-IE 2.0是专门基于ERNIE 2.0模型在开放域信息抽取领域进行优化的模型
- 开放域信息抽取利用单一模型支持多种类型的开放抽取任务,用户可以使用自然语言自定义抽取目标,无需训练即可抽取输入文本中的对应信息。
- ERNIE-IE 2.0技术方案是,将各种类型的信息抽取任务统一转化为自然语言的形式,并进行多任务联合训练,进而支持零样本信息抽取。模型的输入是待抽取文本(content)和自然语言描述的抽取目标(prompt),prompt通常建议的结构为“A的B”或“B”的形式,如下例子:
content:出租方:小明 地址:筒子街12号 电话:12345678900 承租方:小红 地址:新华路8号 电话:18345678901
prompt:地址
result:筒子街12号,新华路8号
content:出租方:小明 地址:筒子街12号 电话:12345678900 承租方:小红 地址:新华路8号 电话:18345678901
prompt:小明的地址
result:筒子街12号
适用场景
适用的场景不限于命名实体、关系、事件论元、事件描述片段、评价、评价维度、观点词、情感倾向等。
模型效果
zero-shot效果
其它相关介绍可参考: http://chanpin.family.baidu.com/article/150747
模型大小
为了适用于不同的性能要求,信息抽取的模型适配了tiny和large两种大小的模型,效果如下:
模型大小 | zero-shot/few-shot | 互联网百科/百家号 | 医疗专病 肺癌 |
---|---|---|---|
ERNIE-IE 2.0-large | zero-shot | 76.66 | 71.40 |
few-shot | 85.05 | 81.56 | |
ERNIE-IE 2.0-tiny | zero-shot | 66.30 | 49.48 |
few-shot | 76.22 | 63.04 |
使用方式
目前我们在开放域信息抽取任务中提供了详细的ERNIE-IE 2.0使用Demo,请移步开放域信息抽取