首页
版块
访问AI主站
登录
百度账号登录
Github账号登录
注册
发帖
mosal4hi
0帖子
·
204回复
215
积分
积分商城
1
获赞
Ta的动态
Ta的帖子
Ta的回复
语音识别那里,如果我想识别后的语音 要传输的服务器上,然后从服务器下载播放,整个流程该如何实现
Ta的回复 :识别服务不对语音做额外存储工作,所以没有api。原始语音的获取及存储方式由应用方实现。
6
请问我这里词库设置后一直处于处理中,很多天都没办法成功
Ta的回复 :词库部分在进行升级,暂时还不可用。
1
如何压缩和上传语音文件
Ta的回复 :识别、合成都有api文档及demo,可在官网查看
3
amr格式的文件识别不了
Ta的回复 :应该是某些参数有问题,比如文件大小不匹配,格式错误等
1
linux开发web端文本转语音程序
Ta的回复 :可参考语音合成的rest api开发文档
1
运行语音识别restful api的php sample时,服务器返回 413 Request Entity Too Larg
Ta的回复 :对语音长度是有限制的,700k应该超过1分钟了。
3
ajax js 请求access_token 请来个实例!谢谢
Ta的回复 :token一旦获取是长期有效的,建议直接用http get获取token即可
1
关于识别结果的格式问题
Ta的回复 :1.sdk是支持的,目前api还没有,后续可以扩展参数来支持 2.可否反馈下具体case?
1
语音合成:411 - Length Required
Ta的回复 :在浏览器上功能可用吗,还请提供完整的url信息。
3
请问语音识别开放查看置信度(匹配程度)的接口吗?
Ta的回复 :sdk有离线功能,可以参考sdk文档
1
运行语音识别restful api的php sample时,服务器返回 413 Request Entity Too Larg
Ta的回复 :post 小于700k是可以的吗?如果是的话就跟限制有关。callback的处理方式有些不同。
3
每次上传的语音数据是独立的吗?会跟下一段语音连接起来一起识别吗?
Ta的回复 :restapi是一次请求上传完整语音,多次请求之间没有连接性。sdk是一个完整语音多次上传的,应该能满足你的需求。
0
能否提供C#调用REST_API的实例代码?
Ta的回复 :抱歉,目前没有c#的rd,而且rest api的demo只是一个普通http请求,参考demo的话,有c#基础的童鞋应该很容易搞定了。
1
提交 speex 返回3301错误
Ta的回复 :请求参数有问题,表单传的话,content-type应该是application/json,body的json中应该包含format ->speex的字段,具体可以参考开发文档。
4
能不能直接把麦克风捕获的AudioInputStream 直接上传进行识别 而不必要保存为.wav格式 再上传
Ta的回复 :可以的,speech直接填stream即可(注意录音采用base64编码,明确录音格式)
1
是否支持arm或MP3格式的语音识别
Ta的回复 :arm的支持,mp3暂不支持。
0
是否支持arm或者MP3格式的音频识别
Ta的回复 :目前主要支持:pcm、wav、opus、x-flac、amr。json中带上format字段,具体配置请参考开发文档。
1
语音合成:411 - Length Required
Ta的回复 :ok
3
是否支持arm或MP3格式的语音识别
Ta的回复 :参考api开发文档。json中format填amr
0
如何提高语音识别准确率?详见内容
Ta的回复 :这个我们后续会做优化。这些case先做收集。
0
1
...
5
6
7
8
9
...
11
切换版块
操作指南
常见问答
平台公告
经验交流
技术专区
文字识别
人脸识别
语音技术
PaddlePaddle
EasyDL
BML
EasyData
AI Studio
UNIT
人体分析
图像搜索
图像识别
内容审核
自然语言处理
机器人视觉
视频技术
增强现实
知识图谱
智能创作
智能呼叫中心
文心
EdgeBoard
DuerOS
EasyEdge
度目硬件
百度AI市场
Doris
AI赛事
百度之星大赛
AI Studio人工智能竞赛
语言与智能技术竞赛
千言数据集
集思广益
共享工具
头脑风暴
成果展示
智能客服