数据管理

更新时间：2025-04-17

数据管理计费明细

数据管理是模型训练的基础来源，数据标注处理（包括数据标注、增强和FAQ挖掘）和创建推理结果集，均涉及计费。

数据标注处理

以下为数据标注处理中可能涉及的计费内容，其计费均照调用在线推理按量后付费形式进行，具体价格可查看按量后付费在线推理计费标准。

功能模块	调用服务	说明
在线标注·读取数据	ERNIE-3.5-8K	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度
在线标注·产出标注	ERNIE-3.5-8K-0205	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度
数据增强·读取数据	ERNIE-3.5-8K	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度
数据增强·产出数据	ERNIE-3.5-8K-0205	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度
FAQ挖掘·上传文件	ERNIE-3.5-8K	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度
FAQ挖掘·产出应答	ERNIE-3.5-8K	百度自研产业级知识增强大语言模型，长了上下文窗口，支持5K输入+2K输出。
	ERNIE-4.0-8K	百度文心系列中效果强大的⼤语⾔模型，理解、生成、逻辑、记忆能力达到业界顶尖水平。
	ERNIE-Speed-8K	百度2024年2月5日发布的初始版本，支持8K上下文长度。
	ERNIE-Lite-8K	2024年3月8日发布版本，优化模型效果，支持8K上下文长度

创建推理结果集

当您选择发起批量推理的方式创建推理结果集时，需要按照批量推理内容计费，具体价格可查看模型服务计费批量推理计费标准。

价格费用举例

大模型服务调用支持使用计算工具计算(输入输出)tokens数。 以ERNIE-3.5-8K大模型为例：

春眠不觉晓，处处闻啼鸟。夜来风雨声，花落知多少。

以上共计20tokens。

示例1：在线标注·自动生成

将以上信息认定为自动标注的标注输出内容，则大模型输出tokens的费用

假设自动标注共计有 20 tokens
以上示例标注所需费用为 = 0.02 千tokens x 0.012(单价) = 0.00024 元

示例2：知识库·索引模式(Embedding-V1服务)

单次导入文档至知识库仅收取一次调用费：上传文档tokens x Embedding-V1调用单价

假设上传的文档中有 27 tokens
则所需的费用为 = 0.027 千tokens x 0.0005(单价) = 0.0000135 元

模型评估

续费和退款说明