整体介绍

更新时间：2022-05-06

简介

Hi，您好，欢迎使用百度EasyDL定制化训练和服务平台。

定制文本分类的模型，是基于自建分类体系的机器学习方法，可实现文本按内容类型做自动分类。平台目前提供的文本分类模型包括：文本分类（单标签）和文本分类（多标签）两种模型类型，请您根据自己的业务场景来选择合适的模型。本文介绍的是关于文本分类（多标签）的模型介绍。

文本分类（单标签）场景：如您对网络文章进行舆情分析，判断舆情是正向评价还是负向评价，即每条文本仅有一个分类标准，此问题属于单标签的文本分类场景；

文本分类（多标签）场景：如您对网络文章进行板块划分，即每条文本有两个及以上分类标准，文章可能属于娱乐、国际、生活等多个标签，则可使用多标签的文本分类模型

更多详情访问：EasyDL自然语言处理方向

应用场景

1、新闻分类：定制训练媒体文章文本的自动分类，识别文章所属的一个或多个领域标签

2、商品名称分类：定制训练商品名称的分类模型，识别商品所属的一个或多个品类

3、其他：尽情脑洞大开，训练你希望实现的文本分类多标签的模型

技术特色

文本分类模型内置文心大模型，将大数据预训练与多源丰富知识相结合，通过持续学习技术，不断吸收海量文本数据中词汇、结构、语义等方面的新知识，实现模型效果不断进化。

文心大模型是百度发布的产业级知识增强大模型，是千行百业AI开发的首选基座大模型。文心大模型既包含基础通用的大模型，也包含了面向重点领域和重点任务的大模型，还提供丰富的工具与平台，支撑企业与开发者进行高效便捷的应用开发。“知识增强”是文心的核心特色，文心能够同时从大规模知识和海量多元数据中持续学习，如同站在巨人的肩膀上，训练效率和理解准确率都得到大幅提升，并具备了更好的可解释性。

使用流程

训练模型的基本流程如下图所示，全程可视化简易操作，在数据已经准备好的情况下，最快15分钟即可获得定制模型。

文本分类-单标签