首页 版块 访问AI主站 注册 发帖
让天涯
3986
积分 积分商城
40
获赞
原帖已删除
Ta的回复 :百度AI能力 通用文字识别(高精度)(https://ai.baidu.com/ai-doc/OCR/1k3h7y3db ) 通用翻译API(标准版)(http://fanyi-api.baidu.com/doc/21 ) 项目地址(https://ai.baidu.com/forum/topic/show/964499 ) 案例 通用翻译API可广泛应用于APP、网站及客户端,提供实时优质的多语言翻译服务。 将此翻译功能部署到网站上,可实现手机拍照翻译的效果(部分手机浏览器的图片上传功能可实现直接拍照上传图片),添加多语种翻译后,基本上就是一个简单的在线拍照翻译网站了。 对于出国游玩、纸质文献翻译等场景,拍照翻译就显得很有必要了。 优化建议 文字翻译结果在简单的语句上是比较准的,速度也是比较快的,但是当语句比较复杂且没有分隔符的时候翻译结果就比较差了,当然这个情况也比较少见,如果能够实现智能断句,提高翻译准确度就更好了。 现在百度AI能力已经比较多,如果把多个AI能力结合在一起,是可以组合成一个比较好的产品的。 比如,就这个通用翻译功能,如果结合语音技术:语音识别和语音合成,识别人说的话,将其转化成文字,然后在进行语音合成输出,那不就是一个语言翻译了吗? PS:目前,百度已经推出了图片翻译能力,可直接实现图片翻译功能,大家可以去体验看看(https://ai.baidu.com/tech/mt/pic_trans ) 语音翻译也有了,好像还没有开放体验(https://ai.baidu.com/tech/mt/speech_trans )
0
原帖已删除
Ta的回复 :百度AI能力 通用文字识别(高精度)(https://ai.baidu.com/ai-doc/OCR/1k3h7y3db ) 在线语音合成(https://ai.baidu.com/tech/speech/tts_online ) 案例 目前中小企业还存在不少一线员工不太认识文字的情况,一些长辈也存在只会听、说,不认识文字的情况,如果可以将百度AI能力的通用文字识别功能和在线语音合成功能结合在一起:通过拍照的方式,将不认识的文字拍照上传,通过通用文字识别功能识别图片上的文字,然后使用在线语音合成功能将文字读出来,那么可以大大帮助不识字的人员通过听的方式了解文字,方便交流。 优化建议 目前在线语言合成只有中英文混合这一种语言,如果能够实现方言的合成输出,那么能够更加方便不识字的人员理解文字内容含义了。
0
原帖已删除
Ta的回复 :任务一: [图片] 任务二: [图片]
0
原帖已删除
Ta的回复 :【语音/图像识别】Logo识别导航:https://ai.baidu.com/forum/topic/show/991487 欢迎大家提出意见。
0
切换版块
智能客服