资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

官方组件调用

序号 组件名称 组件描述 API调用地址
1 文本翻译-通用版 文本翻译组件(Translation)提供200+语种互译的在线文本翻译服务。支持术语定制功能,用户可对翻译结果进行干预,快速提高翻译质量。可广泛应用于移动端、PC网站、智能硬件等不同产品形态中,满足多领域、多场景的翻译需求。 https://console.bce.baidu.com/ai/#/ai/machinetranslation/overview/index
2 文生图 文生图(Text2Image)基于文心大模型,可以根据用户输入的文本,自动创作不限定风格的图,为内容创作者提供灵感和高质量配图。 https://console.bce.baidu.com/ai/#/ai/intelligentwriting/overview/index
3 通用物体和场景识别-高级版 通用物体和场景识别组件(ObjectRecognition)可以识别超过10万类常见物体和场景,接口返回大类及细分类的名称。广泛适用于图像或视频内容分析、拍照识图等业务场景 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
4 通用文字识别-高精度版 通用文字识别组件(GeneralOCR)支持多场景、多语种、高精度的文字识别服务,对图片/文件全部文字内容进行检测识别。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
5 菜品识别 菜品识别组件(DishRecognition)可以识别超过9千种菜品,可准确识别图片中的菜品名称、卡路里,适用于多种客户识别菜品的业务场景中。 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
6 地标识别 地标识别组件(LandmarkRecognition)可以识别12万中外著名地标、热门景点,可返回地标名称。 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
7 短语音识别-极速版 短语音识别(ASR)可以将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于手机语音输入、语音搜索、人机对话等语音交互场景。 https://console.bce.baidu.com/ai/#/ai/speech/overview/index
8 短文本在线合成 短文本在线合成(TTS)提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,精品音库听感更逼真。 https://console.bce.baidu.com/ai/#/ai/speech/overview/index
9 图像内容理解 图像内容理解 (ImageUnderstand),输出理解图片后的文本信息。 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
10 手写文字识别 手写文字识别 (HandwriteOCR),图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
11 动物识别 动物识别 (AnimalRecognition) 可用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出动物识别结果。 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
12 植物识别 植物识别(PlantRecognition),即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。 https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index
13 表格文字识别 表格文字识别 (TableOCR) 可支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持多表格内容识别。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
14 二维码识别 二维码识别 (QRcodeOCR) 可对图片中的二维码、条形码进行检测和识别,返回存储的文字信息及其位置信息。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
15 身份证混贴识别 身份证混贴识别(MixCardOCR),身份证混贴识别支持自动检测与识别身份证正反面在同一张图片上的场景,一次识别图片中身份证正反面所有字段。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
16 文档矫正增强 文档矫正增强 (DocCropEnhance) 可对图片中的文件、卡证、票据等内容进行四角点检测定位,提取主体内容并对其进行矫正,同时可选图片增强效果进一步提升图片清晰度,达到主体检测矫正并增强的目的,提升图片整体质量。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
17 文字识别 文档格式转换 (DocFormatConverter):识别文档内文字及版面布局,可将多种类型的版式文档转换为流式文档。 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
18 百度AI搜索 百度AI搜索(BaiduAISearch),原百度搜索总结。为百度领先的搜索能力结合大模型技术,可提供结合全网实时信息进行智能回复,可支撑各行业丰富的场景应用。 https://cloud.baidu.com/doc/AppBuilder/s/mm3fa3tlh
上一篇
百度AI搜索
下一篇
知识库管理