数据管理
更新时间:2025-04-17
数据管理计费明细
数据管理是模型训练的基础来源,数据标注处理(包括数据标注、增强和FAQ挖掘)和创建推理结果集,均涉及计费。
数据标注处理
以下为数据标注处理中可能涉及的计费内容,其计费均照调用在线推理 按量后付费形式进行,具体价格可查看按量后付费在线推理计费标准。
功能模块 | 调用服务 | 说明 |
在线标注·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
在线标注·产出标注 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
数据增强·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
数据增强·产出数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
FAQ挖掘·上传文件 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
FAQ挖掘·产出应答 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 |
创建推理结果集
当您选择发起批量推理的方式创建推理结果集时,需要按照批量推理内容计费,具体价格可查看模型服务计费批量推理计费标准。
价格费用举例
大模型服务调用支持使用计算工具计算(输入输出)tokens数。 以ERNIE-3.5-8K大模型为例:
春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。
以上共计20tokens。
示例1:在线标注·自动生成
将以上信息认定为自动标注的标注输出内容,则大模型输出tokens的费用
- 假设自动标注共计有 20 tokens
- 以上示例标注所需费用为 = 0.02 千tokens x 0.012(单价) = 0.00024 元
示例2:知识库·索引模式(Embedding-V1服务)
单次导入文档至知识库仅收取一次调用费: 上传文档tokens x Embedding-V1调用单价
- 假设上传的文档中有 27 tokens
- 则所需的费用为 = 0.027 千tokens x 0.0005(单价) = 0.0000135 元