核心诉求
文字识别对很多人来说能极大的提高效率,比如读书笔记摘录,纸质文件转录成电子版,购物小票电子化存储等等,大部分OCR识别软件的价格太贵,且只能单张识别,识别准确度参差不齐,缺少一个价格大众化,准确度高且能批量识别提高效率的软件,白描就是为解决这些而来。
解决方案
白描在开发过程中共使用了两项百度的技术:
首先是最核心的文字识别功能利用了百度文字识别技术,用户选择一张图片之后,可进行裁剪与旋转,确认之后即利用百度的文字识别接口提交到百度进行识别,进而根据识别的位置信息在原图还原文字位置覆盖图层,方便用户手指滑动选择文字或段落。在此基础上研发了自动分段功能方便简化了用户的使用步骤。除此之外,白描还具备批量文字识别的功能,在用户多选了图片之后,按顺序提交给百度服务器完成识别,然后将所有返回结果按顺序拼接起来,即可完成一次批量识别。
除了文字识别技术,白描还使用了百度的翻译技术,在文字识别之后,可以直接点击翻译按钮,此时白描便将待翻译的文字提交给百度服务器进行翻译,然后展示给用户。
普通文字识别:
1. 相册选择需要识别的图片或者拍照;
2. 进入待识别界面,可以选择识别语言,默认为自动检测语言;
3. 提交识别,识别完成后还原文字在图中的位置,方便用户选择;
4. 进入识别结果页面,用户可在此进行翻译、校对或者分享。
批量文字识别:
1. 长按进入多选模式,再点击可选择多张图片;
2. 进入批量识别准备界面,点击识别即进行批量识别,显示批量识别进度;
3. 批量识别全部完成,可进入每一个识别结果选择需要的文字;
4. 所有文字合并,进入识别结果页面,可进行翻译、校对、分享等操作。