产品服务
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
官方认证的硬件产品与百度AI协同应用
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
软硬一体化的远场语音开发套件
硬件赋能
快速赋能移动设备及智能手机
零代码生成高性能端计算模型
高性能计算卡参考方案&软件工具包
端云一体的多模态人机交互解决方案
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
2018/12 百度大脑产品上新&技术升级盘点

与百度AI一起成长,见证AI的力量。

 

2018年12月

新开放AI技术能力

1. 图像识别

  • 地标识别
    地标识别技术开放公测,支持识别约5万中外著名地标、景点,接口返回名称。
    您可以从PC端进入控制台直接开始使用。
  • 车流统计
    车流统计技术邀测上线,根据传入的视频图片序列,进行车辆追踪,返回每个车辆框的坐标、所属ID和车辆类型。用户给定特定区域,根据车辆轨迹判断驶入/驶出区域的行为,返回区域进出车流量(分车辆类型)。同时可输出渲染结果图(含统计值和跟踪框)。
    申请邀测>
  • 车辆检测
    车辆检测技术邀测上线,
    传入单帧图像,检测图片中所有机动车辆,返回图中总车辆数(分车辆类型)和车辆位置。
    申请邀测>


2. 
自然语言处理-文本纠错
文本纠错技术正式开放使用。支持短文本、长文本、语音识别结果等多种文本内容纠错,在搜索引擎、人机对话、语音识别、内容审核等方面有广泛的应用,能显著提高这些场景下的语义准确性和用户体验。
您可以从PC端进入控制台直接开始使用。

3. 知识图谱-作文检索
作文检索技术邀测使用。基于大量作文范文数据库,提供精准体裁类别与多样化标签标记,为日常写作指导场景提供优质作文内容检索服务。
申请邀测>

 

AI技术模型优化、易用性提升

1. 图像搜索
商品图片搜索模型升级,优化同款不同色等典型场景的检索效果。
您可以从PC端进入控制台直接开始使用。

2. 自然语言处理

  • 对话情绪识别
    在一级分类下新增7细分的二级情绪类别(喜欢、抱怨、愤怒等),并且给出参考回复话术。帮助企业更全面地把握产品服务质量、监控客户服务质量。
    您可以从PC端进入控制台直接开始使用。
  • 评论观点抽取
    定制版调整优化,不局限于名词+形容词的形式输出标签,使提取和定制策略覆盖更广泛,解决用户反馈的名词+动词(如:包裹破损)提取不出来的问题。
    您可以从PC端进入控制台直接开始使用。


3. 
OCR

  • 护照识别
    新版本上线,修复了“姓名拼音”字段json格式有误的问题,增加“出生地点”字段。
    申请邀测>
  • 名片识别
    新版本上线,对于电话、手机号、公司网址的准确率和召回率都大幅提升。
    申请邀测>
  • 出租车票识别
    在支持北京出租车票外,新增支持上海、深圳出租车票识别。另外,金额、发票代码、号码准确率全面提升
    您可以从PC端进入控制台直接开始使用。


4. 语音识别

更新语音识别接口,标点服务升级为可根据停顿、语义理解有逗号、句号、问号、叹号,适用于输入法模型
您可以从PC端进入控制台直接开始使用。

5. 语音合成
数字、符号的发音修正、部分中文发音不准的问题修复。发音更清晰、更自然。您可以从PC端进入控制台直接开始使用。

6. 人像分割
优化接口易用性,接口返回增加灰度图和人像前景抠图,方便查看可视化分割效果。您可以从PC端进入控制台直接开始使用。

7. 图像审核
图文审核能力优化,结合百度AI文本审核、OCR高精度版两大能力,主要面向电商、社交、视频直播等行业用户,有效降低图文类作弊的筛查成本,帮助客户解决更多图文审核中遇到的困难您可以从PC端进入控制台直接开始使用。

 

定制化平台与工具

1. 语音识别自训练平台 开放邀测
使用业务场景语料,自助训练语言模型,精准识别语音内容,提升业务领域识别准确率。申请邀测>

2. 理解与交互技术UNIT

  • 新增7个预置技能
    新增预置技能:通讯录、闹钟、故事、智能写诗、智能对联、名词解释、音乐。现共计提供17个预置技能,轻松获取智能对话能力!
  • 问答模板
    FAQ可用模板配置,改变单一穷举相似问题的方式,提升FAQ的泛化能力大幅提高开发者使用问答意图的效率。
  • 对话模板数量上限增至3万条
    每个技能可配置的对话模板数量上限,由2万条上调至3万条。
  •  离线开源框架中控对话US Kit
    在实际业务场景中常需要同时调用多个技能(例如早教机场景的音乐控制、儿歌控制),US Kit可控制多个技能间的触发逻辑,解决复杂对话管理的中控需求。
    查看详情>


3. 自定义模板文字识别iOCR

  • 新增参照字段编辑功能
    开发者可手动修改识别错的参照字段,提高模板匹配成功率进而提高结构化成功率/准确率。
  • 新增参照字段校验功能
    对不规范的参照字段选取进行提示帮助用户纠正,如参照字段为空、参照字段跨行等,提高模板匹配成功率进而提高结构化成功率/准确率。
  • 新增手写数字识别区功能
    您可以从PC端访问ai.baidu.com/tech/ocr/iocr直接使用。

 

AI硬件产品与服务

1. 抓拍机端云协同平台EdgeCloud
升级:在一期的抓拍机接入功能基础上,提供云端的设备管理及业务处理功能(包括图片过滤、云端属性分析、人脸检索功能),使用百度官方推荐抓拍机,配合Edge cloud,无需开发任何代码即可走通人脸识别的完整流程,0代码开发Demo。建议
您从PC端访问http://ai.baidu.com/tech/edgecloud/capture了解更多。

 

百度大脑解决方案

【专项解决方案】

1. 课堂专注度分析解决方案
基于摄像头采集的图像信息,识别学生在课堂上的行为、表情、微动作、物品等要素,综合评估上课专注度,为学校、教育机构评估教学质量并采用针对性的提升方法提供精准依据。查看详情>

【行业解决方案】

1. 智能校园解决方案
赋能软硬件教学产品,实现更好的人机交互的教学体验;同时打造智能校园,实现校园安全、校内考勤、课堂效果监测等关键场景业务升级,提升校园生活体验和安全性,降低管理成本。查看详情>

2. 智能政务解决方案
融合语音技术、人脸识别、文字识别等多项AI技术,应用到政府办公、信息管理和公共服务等场景中,助力政务决策、业务流程优化,提升利企便民服务体验。查看详情>

 

百度AI市场

1. 数家优质服务商入驻AI市场,发布AI配套产品,促成应用场景落地
华捷艾米、广东中科、欧维时代、东视、麦哲、途鸽等多家优质服务商于AI市场火热售卖镜头模组、人脸抓拍机、门禁闸机、Wifi翻译机等AI相关产品,性价比高,品质有保障。  欢迎选购>

2. 功能优化

  • 商品发布流程优化
    服务商更新商品信息无需下架商品,买家体验更稳定。同时增加商品预览、裁图工具等功能,服务商发布商品效率提高一倍。
  • 支持议价改价
    买家下单后,服务商在后台可自主降价,满足大客户议价需求,为买卖双方提供自由的交易空间。
  • 支持EasyDL定制化文本分类API发布售卖
    在EasyDL定制化训练平台中的模型所生成的定制化文本分类API,可放至百度AI市场中售卖。这不仅将获得大量用户浏览关注,增强企业品牌曝光,同时买家还可以在AI市场中一键下单购买,轻轻松松获得商业变现。


建议您从PC端访问百度AI市场(ai.baidu.com/market),选购
AI配套服务。

 

百度AI体验中心微信小程序

1. 优化出租车票识别
在支持北京出租车票外,新增支持上海、深圳出租车票识别。可用于财务报销核对,自动识别票据录入电子系统,减少人工校验成本。

2. 新上线手势识别
支持OK、点赞、Diss作揖、祈祷、数字等
22种手势识别,可应用于视频直播手势特效、智能家居手势交互、智能驾驶手势操控等场景。
目前“百度AI体验中心”共31个AI能力可体验。听说体验过的小伙伴们都忍不住分享到朋友圈!微信扫一扫立即体验↓

百度AI小程序

 

欢迎持续关注百度AI开放平台。如需咨询,您可点击【立即咨询】,提交详细需求。