开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
保益
北京保益互动科技发展有限公司致力于用科技手段解决视障者无法看见的问题,让他们使用数码设备成为现实。
使用产品
支持与交流
百度AI识别技术让视障者"变看为听"了解世界
价值成果
1、保益盲人随心看解决方案,通过百度文字识别,图像识别,语音合成技术真正实现了所见即所听,通过百度AI大数据支持,识别正确率达到了前所未有的高度。
2、百度AI识别,从根本上解决了困扰视障者的问题,如无法认知药品,食品包装,无法对某些特定事物进行了解,可以说百度AI识别,给他们带来了一双智慧的眼睛。
3、打破了信息无障碍的壁垒,过去如果让视障者操作某一款不符合无障碍标准的软件几乎是不可能的,需要与软件厂商进行反复沟通,从软件UI层面进行修改,这是一个非常漫长且艰辛的过程,还要看厂家是否愿意配合,如今融入了百度AI识别,从被动变成了主动,当AI识别返回带坐标的结果后,通过本地二次算法,在UI上实现自动文字标记,把可视化UI转换成可点击的标准文字提示,瞬间解决了百分之七十以上的信息障碍问题。
案例故事
核心诉求
如何让视障者没有障碍的使用各种数码产品,如何让他们借助科技的力量看的更远,如何把真实的世界展现在眼前,是我们一直所追求的目标。
解决方案
保益盲人随心看解决方案:应用了百度文字识别,图像识别,语音合成三项技术,实现了视觉到听觉的转换。具体方案如下:
文字识别:通过调用文字识别(标准版和高清版),用于对摄像头传入的图像进行识别,把图像转换成语音,并借助语音合成tts进行播报,可帮助视障者对纸质文档进行辨识。另外,文字识别(含位置版),可将在数码设备上通过屏幕截图提交的图片,返回包含位置信息的文字,在经过二次算法和本地化向,实现对原来可视化界面无法读取的按钮,进行相关操作。
图像识别:通过摄像头或屏幕截图,对无法认知的物体,植物,动物,直接返回比较准确的文字识别结果,帮助视障者认识身边的环境成为了现实。
Step1:用户注册或者登录软件,确认用户信息
Step2:用户选择拍照或者识别模式,进行拍照识别
Step3:由百度OCR返回识别信息,提示给用户
Step4:对图片或者相册进行OCR识别,返回识别结果
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区