近日,自然语言处理领域权威排行榜——GLUE(通用语言理解评估基准)新排名出炉。百度自研的语义理解技术与平台文心(ERNIE)以90.9的分数再登榜首,领先微软DeBERTa/TuringNLRv4,谷歌T5以及阿里巴巴、华为等研发的其他同类别技术。
在技术产业落地的进程中,文心也在不断发力,将最新的世界级技术突破转化为易用的产品工具,携手EasyDL平台提供了一整套简单高效的NLP开发能力,有效提升模型开发与应用效率。
针对用户文本信息抽取的需求,文心上线了“文本实体抽取”和“文本实体关系抽取”功能,支持从海量信息源中抽取出特定的实体,并定义实体间的关系。如抽取保险合同中的投保人、投保年限等信息,并建立两者间的关系,辅助保险经理人分析判断。
那如何快速给数据打标签?
怎样达到高精度的模型效果?
如何从简单信息抽取到构建知识图谱?
零深度学习经验能轻松上手吗?
…
针对以上问题,3月25日,百度EasyDL-NLP专场直播课“从技术解析到实战演练,文本信息抽取模型精讲”来袭,从数据处理到模型训练,全程0代码可视化操作,教你快速掌握“信息抽取”技能。
课程亮点,先睹为快!
实体抽取与实体关系抽取,高效获取知识
“文本实体抽取”作为文本挖掘和信息抽取的核心任务,支持从海量信息源中抽取出特定的事实信息,是信息检索、智能问答、智能对话等人工智能应用的重要基础;“文本实体关系抽取”除了能抽取出预定义的实体类型,还能抽取出实体间的关系类型,得到包含语义信息的实体关系三元组,可用于构建和扩充知识图谱。例如:“王雪纯是87版《红楼梦》中晴雯的配音者。”可以抽取出“王雪纯-配音-红楼梦”这一组关系。
在线智能标注,节约成本
为提升该项能力的易用性,文心还针对数据准备难题,发布了基于2项任务的数据标注工具,支持在文本中直接划选进行标注,给标注人员带来极佳的标注体验和更高的标注效率。如下图所示,可以通过可视化的操作直接对目标信息进行标注,抽取金融类合同中的企业主体、注册资本,并直接建立两者间的关系。
除了上述新功能的介绍,课程还将带领大家全流程实践操作,从了解原理到定制模型,从跟随操作到独立实现,快速打通文本信息挖掘的任督二脉。
百度工程师手把手教学案例实现
本次公开课,百度工程师将从创建模型、准备数据、训练模型、校验模型、发布模型全流程进行实操演练,带领大家基于样例数据三步定制一个实体关系抽取模型。还在等什么,速速报名吧,让我们一起见证文本智能化的神奇魅力!
时间:3月25日20:00-21:00
报名方式:点击报名链接https://iwenjuan.baidu.com/?code=637tuz 或扫描下方海报中的二维码,添加小助手微信,备注“NLP”,获取专属报名通道。参与课程,还有爱奇艺VIP黄金会员月卡、百度大脑定制马克杯等惊喜礼品等你拿!
更多“课程介绍”及“课程亮点”见下图!
已报名
已报名。