开放能力
开发平台
行业应用
生态合作
开发与教学
技术能力
语音技术
语音识别
语音识别
识别率高,支持中文、英语、粤语、四川话等
语音识别极速版
极速识别60秒内语音,简单易用
长语音识别
支持将不限时长的语音实时转换为文字
远场语音识别
适用于智能家居、机器人等远场的语音识别
语音合成
在线合成-基础音库
提供标准男声女声、情感男声女声四种发音人
在线合成-精品音库
提供包含童声在内的五种精选发音人
离线语音合成
在无网或弱网环境下,可在智能硬件设备终端进行语音播报
呼叫中心语音
实时语音识别
企业级服务,实时识别呼叫中心语音
音频文件转写
低成本进行大批量呼叫中心音频转写
图像技术
图像审核
色情识别
智能识别图片和视频中的色情和性感内容
暴恐识别
血腥场景及恐怖组织头目,旗帜等违禁内容
政治敏感识别
识别政治人物与敏感政治事件场景
广告检测
检测图像中的文字、水印、二维码、条形码
恶心图像识别
准确识别恶心,令人不适类的图像
图像质量检测
检测图像色彩、构图及清晰度情况
图文审核
图像中的文字内容进行多维度审核
公众人物识别
支持国内外16万个公众人物人脸识别
车辆分析
车型识别
识别3千款常见车型,可返回车型百科信息
车辆检测
检测图像中所有车辆,识别车辆类型和位置
车流统计
基于车辆检测和追踪,统计进出车流量
车辆属性识别
识别小汽车11种外观属性,如是否有车顶架
车辆损伤识别
针对常见小汽车,识别外观部件受损情况
车辆分割
识别车辆的轮廓范围,与背景进行分离
图像识别
通用物体和场景识别
识别超过10万类常见物体和场景
品牌logo识别
识别2万类商品logo,支持定制logo图库
植物识别
识别2万多种通用植物和近8千种花卉
动物识别
识别近8千种动物
菜品识别
识别超过5万种菜品,支持定制菜品图库
地标识别
识别5万中外著名地标、景点
果蔬识别
识别近千种水果和蔬菜
红酒识别
识别数十万中外红酒名称及详细介绍
货币识别
识别国内外常见货币,支持正反面、纪念钞
图像主体检测
检测图片内主体的坐标位置
门脸识别
识别20万类商店门脸,支持自建门脸库
图像搜索
相同图片搜索
适用于图片精确查找、重复图片过滤
相似图片搜索
语义相似的图片集搜索,支持亿级图库
商品图片搜索
以图搜商品,拍照搜同款,相似商品推荐
图像效果增强
图像去雾
对浓雾天气下拍摄的图像进行去雾处理
图像对比度增强
调整过暗或者过亮图像的对比度
图像无损放大
将图像在长宽方向各放大两倍,保持质量无损
黑白图像上色
智能识别黑白图像内容并填充色彩
拉伸图像恢复
识别过度拉伸图像内容,并恢复成正常比例
图像风格转换
将图像转换成卡通画或素描等风格
图像修复
去掉图片中不需要的遮挡物;修复图片缺损内容
文字识别
卡证文字识别
身份证识别
识别二代居民身份证正反面所有8个字段
银行卡识别
识别银行卡卡号、有效期、卡类型、发卡行
营业执照识别
识别各版式营业执照所有关键字段
名片识别
识别姓名、公司、职位、电话、地址等字段
护照识别
识别中国大陆护照个人资料页所有10个字段
港澳通行证识别
识别卡号、中英文姓名、有效期限等字段
台湾通行证识别
识别卡号、中英文姓名、有效期限等字段
户口本识别
识别姓名、身份证号、出生地、出生日期等字段
出生医学证明识别
识别新生儿姓名、性别、生日、父母姓名等字段
票据文字识别
增值税发票识别
识别增值税普票或专票所有30个字段
定额发票识别
识别各类定额发票的代码、号码、金额字段
通用机打发票识别
识别国家/地方税务局发行的机打发票信息
火车票识别
识别红、蓝火车票的8个关键字段
出租车票识别
识别全国各大城市出租车票的6个关键字段
行程单识别
识别飞机行程单的姓名、日期、票价等字段
通用票据识别
针对票据场景专项算法优化,按行识别各类票据
保险单识别
识别人身保险保单的投保人/被保人/受益人信息
彩票识别
识别大乐透、双色球彩票票面内容,按行返回
教育场景文字识别
手写文字识别
支持对图片中的手写中文、手写数字进行检测和识别
公式识别
支持对试卷中的数学公式及题目内容进行识别
汽车场景文字识别
行驶证识别
识别机动车行驶证主页及副页所有21个字段
驾驶证识别
识别机动车驾驶证正本所有9个字段
车牌识别
识别蓝牌、绿牌、单/双行黄牌等类型车牌
VIN码识别
识别车辆挡风玻璃处的车辆识别号码
机动车销售发票识别
识别发票号码、发动机号、VIN码、价格等字段
车辆合格证识别
识别合格证编号、车架号、排放标准等字段
其它文字识别
网络图片文字识别
识别艺术字体或背景复杂的文字内容
表格文字识别
识别表头、表尾及每个单元格的文字内容
数字识别
对图片中的数字进行提取和识别
二维码识别
对图片中的二维码、条形码进行检测和识别
印章检测
支持对合同文件或常用票据中的印章进行检测
人脸与人体识别
人脸识别
人脸检测
返回人脸框与关键点,识别多种人脸属性
人脸对比
评判两张人脸图片的相似程度
人脸搜索
将一张图片在指定人脸库中进行1:N搜索
活体检测
抵御人脸识别过程中的图片、模具等作弊攻击
身份验证
满足各种场景下身份核验的灵活需求
离线采集SDK
离线的人脸检测、人脸追踪、人脸采集等能力
离线识别SDK
离线的人脸采集、活体检测、人脸比对与识别能力
私有化部署包
部署到「本地服务器」的「纯软件」人脸识别模型
人体分析
人体关键点识别
精准定位人体21个核心关键点,适应大动作
人流量统计
统计图像中的人体个数和流动趋势
人体检测与属性
检测图像中的所有人体,识别20余类属性
手部关键点识别
定位手部21个核心骨节点,返回坐标信息
私有化部署包
部署到「本地服务器」的「纯软件」人体识别模型
行为分析
驾驶行为分析
识别驾驶员抽烟、使用手机等违规行为
手势识别
识别24种常见手势,支持自拍、他人拍摄
危险行为识别
针对5S内的监控视频片段,识别常见危险行为
人像特效
人脸融合
将两张人脸的外貌特征融合并生成新的人脸图片
人像分割
识别图像中的人体轮廓,与背景进行分离
AR与VR
增强现实
AR核心技术
构建虚实互联的基础设施,变革人机交互的创新体验
AR内容平台
高效的AR内容制作和发布管理一站式开放平台
虚拟现实
VR视频SDK
能力全面、支持多平台、兼容普通模式
全景图片SDK
VR渲染、标注、漫游、人机交互等多项能力
自然语言处理
语言处理基础技术
词法分析
提供分词、词性标注、命名实体识别
词向量表示
帮助完成语义挖掘、相似度计算
词义相似度
通过词语向量化来计算两个词之间的相似度
依存句法分析
自动分析文本中的依存句法结构信息
DNN语言模型
判断一句话是否符合语言表达习惯
短文本相似度
计算两个短文本之间的语义相似度,实现推荐、排序等应用
语言处理应用技术
文本纠错
识别文本中的错别字,给出提示以及正确的建议文本内容
情感倾向分析
对包含主观信息的文本进行情感倾向性判断
评论观点抽取
分析评论关注点和观点,输出标签及观点极性
对话情绪识别
识别会话者所表现出的情绪类别及置信度
文本标签
输出能够反映文章关键信息的多维度标签
文章分类
输出文章的主题分类及对应的置信度
新闻摘要
抽取关键信息并生成指定长度的新闻摘要
地址识别
精准提取快递填单文本中的姓名、电话、地址信息
机器翻译
通用翻译API
支持28种语言的语言检测和实时互译
定制化翻译API
提供定制化训练翻译引擎服务
语音翻译SDK
轻松实现语音到语音的翻译服务
拍照翻译SDK
轻松实现图片识别及文本翻译
垂直领域API
面向特定行业,翻译结果更为精准
语种识别API
支持六种语言的语种识别
AI同传
高质量、低延迟的机器同传服务解决方案
数据智能
大数据处理
大数据传输
提供对多种系统间多种模式的数据传输支持
数据工厂
基于Spark的统一批量和流式数据处理系统
数据治理
基于元数据驱动的一站式数据治理平台
可信数据计算
数据加密算法与多方安全计算服务
大数据分析
数据仓库
PB级关系数据分析引擎,多维分析服务
搜索分析
全托管的Elasticsearch服务
数据科学平台
一站式数据挖掘集成开发环境
大数据可视化
一站式的大数据商业智能可视化平台
统计与推荐
网站统计
专业的网站数据分析平台
移动统计
专业的APP流量分析工具
智能推荐
基于大数据挖掘的个性化内容推荐引擎
舆情分析
舆情平台
专业、开放、易用的互联网舆情分析平台
舆情API
个性化定制輿情分析能力,准确把握时事脉搏
大数据风控
保险风险定价
识别用户风险,实现精准定价,降低赔付成本
保险反欺诈
甄别欺诈风险,提升理赔效率,减少欺诈赔付
智能个人风控
从贷前审批到贷后管理,全流程整体解决方案
智能企业风控
深度刻画企业,多维度、多层面风险评估预警
大数据营销
智客
专业的实体门店分析工具,助力商家智能运营
觅客
全渠道投放与转化分析服务,数字化营销闭环
汇客
全域数据融合,多维筛选专项分析服务
炫客
商业智能可视化套件,所见即所得
客情
客户销售意图预测,客户群体特征分析
商情
挖掘合适的潜在企业客户,预测销售转化
司南
全面、专业的品牌营销辅助分析工具
知识生产与理解
智周
可灵活对接多种智能终端的新一代智能知识库
智珠
文本类数据的分析挖掘及知识生产服务
知识图谱
知识理解
实体标注
结合百科知识库进行文本知识解析
汉语检索
汉语领域的知识检索服务
知识问答
提供多领域、细粒度的知识问答服务
作文检索
提供体裁类别与多样化标签标记、内容检索
场景方案
场景方案
企业服务
人脸实名认证
识别用户是否为“真人”且为“本人”
人脸闸机
多硬件环境适配的大规模端云人脸识别
人脸考勤
高精度的人脸识别、对比能力,搭建考勤系统
电商评论分析
挖掘电商评论中的核心观点
呼叫中心语音解决方案
呼叫中心场景端到端的语音技术解决方案
智能零售
门店智能顾客管理
实现人流统计、客群分析、会员识别以及店员管理
人脸会员识别
会员人脸注册、会员识别的成套方案
智能货柜
基于视觉的商品识别,适配主流立式货柜
自助结算台
通过摄像头自动识别结算区商品,快速结算
线下门店陈列洞察解决方案
提升线下店面管理与执行的效率和效果
AR商品包装展示
通过领先AR技术,生动呈现品牌创意主张
信息服务
行业知识图谱解决方案
提供知识图谱构建一站式解决方案
语音搜索解决方案
语音输入到百度搜索结果输出的完整解决方案
虚拟真人助理
定制虚拟视觉助理形象的解决方案
AR娱乐互动解决方案
为视频、直播等全场景提供一站式AR娱乐互动解决方案
智能医疗
医学文本结构化
将自然语言表达的医学文本转化为结构化数据
智能分诊
分析患者表达的不适,智能定位科室及医生
智能工业
工厂安全生产监控
监测员工着装、生产作业、仪表指标等异常
工业智能质检
工业产品的外观瑕疵进行自动化识别
AR汽车展示
构建从汽车生产、展示到消费端的全场景解决方案
智能教育
课堂专注度分析
识别课堂行为、物品,评估学生上课专注度
AR教育行业解决方案
引领互动式AR体验教学,变革传统教育模式
智能硬件
EdgeBoard嵌入式AI解决方案
面向嵌入式与边缘部署场景的FPGA AI加速方案
机器人导航和视觉
为机器人打造立体视觉解决方案
AR智能设备解决方案
赋能智慧大屏、AR眼镜等多样化终端设备
部署方案
部署方案
设备端部署
离线SDK
针对多种芯片优化加速,支持全平台操作系统
EasyEdge端计算模型生成
生成端模型及SDK,适配多种芯片与操作系统
服务端部署
Ai产品私有化解决方案
本地服务器一键部署,安全易用
DuEdge边缘网络计算
节点遍布全国,Serverless环境函数计算
软硬一体部署
EdgeBoard深度学习计算卡
高性能计算卡参考方案&软件工具包
EdgeBoard边缘AI计算盒
高性能、支持多模型私有化部署的微型AI服务器
人脸识别开发套件-壁虎
软硬一体化的人脸识别开发套件
PaddlePi终端运算模块
紧凑小巧、性能优越的AI核心运算处理单元
远场语音开发套件
软硬一体化的远场语音开发套件
人脸抓拍机
支持最多30人脸同时检测和跟踪
百度大脑认证硬件产品
认证的硬件产品与百度AI协同应用
开发平台
开发平台
开发平台
飞桨PaddlePaddle
百度自主研发的源于产业实践的开源深度学习平台
AI Studio
基于百度深度学习平台飞桨的一站式AI开发平台
EasyDL可视化模型训练与服务平台
一站式定制高精度AI模型
语音自训练平台
零代码自助训练语言模型,提升业务领域识别率
iOCR自定义模板文字识别
自助定制专属模板,实现海量单据卡证的结构化识别
对话定制与服务平台UNIT
智能对话系统定制平台,快速拥有对话交互能力
智能创作平台
提供自动创作和辅助创作的能力,提升内容创作效率
内容审核平台
通过界面化的操作,提升审核效率,降低人工成本
EasyEdge端计算模型生成平台
快捷生成端计算模型及封装SDK
智能视频监控开发平台
针对视频监控场景,提供丰富的预置AI技能
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
行业能力
场景方案
部署方案
行业应用
智能工业
智能零售
企业服务
智能政务
智能教育
智能农业
信息服务
智能园区
智能硬件
智能医疗
AI公众号
关注AI公众号
获取AI资讯,体验AI能力