合作伙伴
资讯
社区

关于我们

"百度大脑"已建成超大规模的神经网络,拥有万亿级参数、千亿样本、千亿特征训练,能模拟人脑的工作机制
简介
百度大脑面向企业/机构/创业者/开发者推出的以 API 或 SDK 的形式,将人工智能的图像、语音、自然语言处理、用户画像等核心能力对外共享。 作为最早布局人工智能的技术公司之一,“百度大脑”已建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。
百度大脑如今智商已经有了超前的发展,在一些能力上甚至超越了人类。开放的百度大脑,将引领整个互联网行业进入下一幕。
百度大脑官网"ai.baidu.com”依托强大的底层技术、开源的算法模型,将全面、易用的核心能力进行输出。
底层技术
AI超级计算机
AI超级计算机,是专门为基于人工智能应用所定制的国内最早的超高速异构计算集群,融合了百度自主研发高密度的异构计算服务器,GPU Box、FPGA等,是构成百度大脑的核心基础技术。
百度AI超级计算机在相关技术领域累计产生专利超过60项。在ASPLOS、HOTCHIPS、EuroSys、IEEE-Thermal,Inter-PACK等国际著名会议发表10余篇学术论文。
这项技术有效支撑全球最大的深度神经网络百度大脑,提升机器学习计算性价比数百倍;更产生了巨大的社会效应。
算法模型
PaddlePaddle
PaddlePaddle——Parallel Distributed Deep Learning(并行分布深度学习),能够充分利用多机多显卡计算资源,用无填充的循环神经网络,进行稀疏化的计算和精细的计算优化。
在全球中,它的计算速度和能力领先,具有易用,高效,灵活和可伸缩等特点。目前已对全球开发者实现开源。
核心能力
1. 语音技术
百度Deep Speech 2系统只通过大量的数据,就可以自动掌握语言的全部细节以及人类的说话方式。作为第一个生产级别的语音引擎,通过“端到端深度学习技术”,整个语音系统被极大的简化。此技术让我们可以运用相同的技术去打造不同语言的语音识别系统。目前,它在口语识别的准确度方面十分惊人, 达到了97%的准确率。被MIT科技评论评为2016年十大突破技术之一。
百度语音合成-情感合成技术,运用最新的机器学习算法进行从文本到语音的转换,使得语音合成的效果和真人一样自然逼真并且情感丰富。情感语音合成技术完成了超大规模数据录制,处理以及多项合成算法突破,颠覆了传统语音合成的技术路线和数据处理方法,在业内首次上线情感合成服务产品和用户,目前已经被应用到了小说阅读,搜索展现,新闻播报和地图导航等诸多场景
深度语音识别技术和情感语音合成技术的突破,让人和机器真正无障碍的自然交流成为可能。
提供的主要功能:
√ 语音识别:语音识别、语音唤醒
√ 语音合成:语音合成
2. 图像技术
百度大脑图像处理技术基于深度学习算法,智能识别图像类别、内容和含义,支持基于图像识别的场景应用。人脸识别FDDB第一名,准确率98%,召回90%;人脸识别LFW第一名;ICDAR竞赛4项世界第一。
提供的主要功能:
√ 文字识别:通用文字识别、身份证识别、银行卡识别
√ 人脸识别:人脸检测、人脸对比、人脸查找
√ 图像审核:色情识别、暴恐识别
3. 自然语言处理
世界首个互联网神经网络机器翻译系统,世界第一的中文句法分析系统,领先的中文词法分析技术和情感分析技术,学自海量数据的神经网络语言模型工具。
提供的主要功能:
√ 词汇级:词法分析、中文词向量表示
√ 短文本级:中文DNN语言模型、短文本相似度、评论观点抽取
√ 机器翻译:百度翻译开放平台
4. 用户画像
贯通海量大数据,搭建用户画像独有模型,挖掘用户特征标签,体系化地勾勒用户全貌。精准识别用户的基本属性、行为习惯、兴趣爱好和消费需求,了解用户行为意图,根据用户不同的行为特点贴标签、绘制画像,应用于各个领域。
提供的主要功能:
√ 用户画像:用户画像平台
√ 推荐云平台:推荐云平台
5. 其他-AR
利用百度大脑的技术和计算能力,在物体识别、三维环境感知、人机交互等核心方向都建立了绝对优势。
百度AR应用于诸多领域,如互动广告、游戏、教育、医疗、旅游等,让数亿用户体验到AR的神奇效果。
提供的主要功能:
√ AR增强现实
开放形式
1. API
API 直接调用:通过接口形式,直接调用百度大脑各项能力。
2. SDK
移动端&服务端应用SDK:获得开放能力,适合离在线场景,支持java/php等语言,支持 Android / iOS等平台。
快速拥有AI能力
成为开发者
创建应用
获取密钥
生成签名
启动开发

立即获取免费API Key

现在试用,获取免费API Key,免费调用各项开放能力API

免费试用