开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
解说
解说是一个安卓手机上的盲人屏幕阅读器,致力于盲人的公益事业,为盲人用户提供快读语音输入,语音操控,图片识别等服务,让盲人的生活更加便捷。
使用产品
支持与交流
百度语音AI技术,做盲人的“眼睛”
价值成果
解说使用百度AI技术为盲人用户提供快速语音输入,语音操控手机,解决了操作便的问题;使用文字识别,图片识别功能,识别图像中物体的信息、文字信息、货币信息,并且通过百度语音合成技术,将语音播报出来,解决盲人看不到的问题,方便盲人用户的使用。
案例故事
核心诉求
盲人用户在看不到屏幕的情况下使用手机输入,很难使用字母输入的方式。通过对接百度AI 技术,使用解说读屏只需要长按编辑框即可快速启用语音输入,盲人不易找到需要操作的按钮,解说读屏可以让用户使用百度语音快速找到并点击按钮。解说APP的体验升级,通过百度AI赋能,运用了百度的语音识别,语音合成,图像识别的功能,建立了盲人与外界世界的联系,并且只需要一个按键即可实现人机交互功能。
解决方案及配图
通过多方面的考察对比,发现百度提供的AI能力接口稳定性较强,操作方便,并且生产资源投入较低,通过测试,更加明确要使用用百度AI能力,以帮助更多的盲人用户。
第一步:将软件的设置功能开启。
第二步:盲人用户长按按键,说话的内容将会通过设备(手机)传入到百度内部服务器进行转写,系统将会通过接收到的文字进行功能的调用。
第三步:打开拍照语音功能打开拍照功能,将摄像头对准要识别的物品,使用图片识别功能将图片高效快速的传入图片识别的服务器中,进行识别,返回的文字在一次传入百度语音合成的服务中进行操作,之后通过设备进行播放。
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件