资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

整体介绍

简介

Hi,您好,欢迎使用百度EasyDL定制化训练和服务平台。

定制文本分类的模型,是基于自建分类体系的机器学习方法,可实现文本按内容类型做自动分类。平台目前提供的文本分类模型包括:文本分类(单标签)和文本分类(多标签)两种模型类型,请您根据自己的业务场景来选择合适的模型。本文介绍的是关于文本分类(多标签)的模型介绍。

文本分类(单标签)场景:如您对网络文章进行舆情分析,判断舆情是正向评价还是负向评价,即每条文本仅有一个分类标准,此问题属于单标签的文本分类场景;

文本分类(多标签)场景:如您对网络文章进行板块划分,即每条文本有两个及以上分类标准,文章可能属于娱乐、国际、生活等多个标签,则可使用多标签的文本分类模型

更多详情访问:EasyDL自然语言处理方向

应用场景

1、新闻分类:定制训练媒体文章文本的自动分类,识别文章所属的一个或多个领域标签

2、商品名称分类:定制训练商品名称的分类模型,识别商品所属的一个或多个品类

3、其他:尽情脑洞大开,训练你希望实现的文本分类多标签的模型

技术特色

文本分类模型内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。

文心大模型是百度发布的产业级知识增强大模型,是千行百业AI开发的首选基座大模型。文心大模型既包含基础通用的大模型,也包含了面向重点领域和重点任务的大模型,还提供丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。“知识增强”是文心的核心特色,文心能够同时从大规模知识和海量多元数据中持续学习,如同站在巨人的肩膀上,训练效率和理解准确率都得到大幅提升,并具备了更好的可解释性。

使用流程

训练模型的基本流程如下图所示,全程可视化简易操作,在数据已经准备好的情况下,最快15分钟即可获得定制模型。

上一篇
文本分类-单标签
下一篇
数据准备