解说使用百度AI技术为盲人用户提供快速语音输入,语音操控手机,解决了操作便的问题;使用文字识别,图片识别功能,识别图像中物体的信息、文字信息、货币信息,并且通过百度语音合成技术,将语音播报出来,解决盲人看不到的问题,方便盲人用户的使用。
核心诉求
盲人用户在看不到屏幕的情况下使用手机输入,很难使用字母输入的方式。通过对接百度AI 技术,使用解说读屏只需要长按编辑框即可快速启用语音输入,盲人不易找到需要操作的按钮,解说读屏可以让用户使用百度语音快速找到并点击按钮。解说APP的体验升级,通过百度AI赋能,运用了百度的语音识别,语音合成,图像识别的功能,建立了盲人与外界世界的联系,并且只需要一个按键即可实现人机交互功能。
解决方案及配图
通过多方面的考察对比,发现百度提供的AI能力接口稳定性较强,操作方便,并且生产资源投入较低,通过测试,更加明确要使用用百度AI能力,以帮助更多的盲人用户。
第一步:将软件的设置功能开启。
第二步:盲人用户长按按键,说话的内容将会通过设备(手机)传入到百度内部服务器进行转写,系统将会通过接收到的文字进行功能的调用。
第三步:打开拍照语音功能打开拍照功能,将摄像头对准要识别的物品,使用图片识别功能将图片高效快速的传入图片识别的服务器中,进行识别,返回的文字在一次传入百度语音合成的服务中进行操作,之后通过设备进行播放。