近年来,产学研各界在自然语言处理(NLP)领域持续深耕,促进着人工智能技术不断向前发展。技术的应用不仅改变着人类的生活方式,也为产业升级提供了更多可能。
3月30日,聚焦 NLP 领域的2022语言与智能技术竞赛正式启动报名。本次竞赛将联手“千言”数据集开源项目,覆盖跨模态、知识驱动、可信学习等人工智能的前沿课题,发布全新四大任务,并发布中文领域首个搜索知识对话数据集、首个面向实际应用场景的中文大规模段落检索数据集等多个重磅数据集。参赛选手将有机会结合技术前沿课题和实际应用场景,进行技术突破和评测挑战,获胜队伍将分享总额超过20万元的奖金。
NLP 圈顶级赛事
四大任务再升级
本竞赛由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文 NLP 赛事之一。
在2021年的上一届评测中,参赛队伍报名超过3500支,企业队伍占比约20%,覆盖了互联网、通讯、金融、能源、航空航天等多个领域,其中不乏腾讯、华为、阿里巴巴、字节跳动、国家电网、中国移动等知名企业;高校队伍占比约50%,覆盖了清华大学、北京大学、复旦大学、中国人民大学、慕尼黑工业大学、早稻田大学、爱丁堡大学等300多所国内外高校。评测累计收到有效提交结果1万多次,竞争非常激烈。
据了解,2022年竞赛对赛题设置进一步升级,推出四大全新任务:
联手千言,首发多个重磅数据集
推动人工智能技术进步的三大驱动力是算法、算力和数据。在这三者中,数据作为算法学习的基础,其数量和质量直接决定了算法能够达到的上限水平,好的语料可以极大推动相关领域的技术发展和行业进步。
而在自然语言处理领域,英文的开源数据集百花齐放;反观中文数据集,存在开源数量少且分散的情况。为了推动中文 NLP 数据和技术的发展,“千言”开源数据集项目应运而生。
本次语言与智能技术竞赛联手“千言”项目,首次公开多个最新中文数据集:来源于实际应用场景的大规模段落检索数据集 DuReader_Retrival、领域开放的搜索知识对话数据集 DuSINC、情感分析可解释数据集 DuExplain、大规模视频语义理解数据集 DuVUnderstanding。这些数据集具有很高的技术价值,将在本次评测期间,免费开放给参赛选手进行技术研究和探索。
另外,为了全力创造最佳竞赛条件,充分激发选手的创新灵感,百度作为本次大赛承办方为参赛选手提供了全面的技术资源和平台支持。其中,百度飞桨平台为四大竞赛任务提供了基线系统,帮助选手快速上手。同时,基于百度飞桨的人工智能学习与实训社区 AI Studio 还提供了在线编程环境、免费 GPU 算力支持,打破算力桎梏,在竞赛全流程为选手斩获佳绩护航。
2022语言与智能技术竞赛将于3月30日正式开启报名通道,欢迎进入“2022语言与智能技术竞赛官网”(http://lic2022.cipsc.org.cn)了解详情、进行报名。
微信扫一扫
关注该公众号