核心诉求
如何让视障者没有障碍的使用各种数码产品,如何让他们借助科技的力量看的更远,如何把真实的世界展现在眼前,是我们一直所追求的目标。
解决方案
保益盲人随心看解决方案:应用了百度文字识别,图像识别,语音合成三项技术,实现了视觉到听觉的转换。具体方案如下:
文字识别:通过调用文字识别(标准版和高清版),用于对摄像头传入的图像进行识别,把图像转换成语音,并借助语音合成tts进行播报,可帮助视障者对纸质文档进行辨识。另外,文字识别(含位置版),可将在数码设备上通过屏幕截图提交的图片,返回包含位置信息的文字,在经过二次算法和本地化向,实现对原来可视化界面无法读取的按钮,进行相关操作。
图像识别:通过摄像头或屏幕截图,对无法认知的物体,植物,动物,直接返回比较准确的文字识别结果,帮助视障者认识身边的环境成为了现实。
Step1:用户注册或者登录软件,确认用户信息
Step2:用户选择拍照或者识别模式,进行拍照识别
Step3:由百度OCR返回识别信息,提示给用户
Step4:对图片或者相册进行OCR识别,返回识别结果