首页 版块 访问AI主站 注册 发帖
周俊316
1262
积分 积分商城
92
获赞
ios 语音识别崩溃
Ta的回复 :tanxj920: 我使用的服务是:语音识别 调用的接口是:BDVRRawDataRecognizer 参数设置情况:BDVR_CONFIG_KEY_DISABLE_AUDIO_SESSION_CONTROL  YES 开发平台和机型:iOS 10.2.1-iphone6s SDK版本号:离在线融合2.0.1 代码或日志截图(上传截图能帮助您更快解决问题): [图片] [图片] 复现步骤、现象及其他描述:经常在运行一段时间后出现以上错误。有时十几秒,有时十几分钟。 回复tanxj920: 建议您使用最新版本的SDK [图片]
6
离线语音识别老是提示“网络不稳定,请稍后再试”
Ta的回复 :淘菜猫吧: 我使用的服务是:离在线语音识别 调用的接口是: startActivityForResult(it, REQUEST_UI); 参数设置情况: intent.putExtra(Constant.EXTRA_SOUND_START, R.raw.bdspeech_recognition_start); intent.putExtra(Constant.EXTRA_SOUND_END, R.raw.bdspeech_speech_end); intent.putExtra(Constant.EXTRA_SOUND_SUCCESS, R.raw.bdspeech_recognition_success); intent.putExtra(Constant.EXTRA_SOUND_ERROR, R.raw.bdspeech_recognition_error); intent.putExtra(Constant.EXTRA_SOUND_CANCEL, R.raw.bdspeech_recognition_cancel); intent.putExtra("sample", 16000); // 离线仅支持16000采样率 intent.putExtra("language", "cmn-Hans-CN"); // 离线仅支持中文普通话 intent.putExtra("prop", 20000); // 输入 intent.putExtra(Constant.EXTRA_NLU, "enable");//语义解析 intent.putExtra("grammar", "assets:///baidu_speech_grammar.bsg");//词条 开发平台和机型:android studio SDK版本号:25 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 先用在线语音可以识别,再关掉网络就没法识别了,老是提示“网络不稳定,请稍后再试”,搞不懂了,本来就是离线,怎么还提示我网络不稳定 BaiduASRDigitalDialog中的onFinish中的errorType=2,errorCode=2 回复淘菜猫吧: 您好, 您先进行授权,请到 http://yuyin.baidu.com/docs/asr/166核对程序中设置和应用是否一致(如api key和sercret key),然后您第一次联网设置授权后,就可以使用服务了
1
关于百度语音离在线sdk的几个疑问
Ta的回复 :lll112012: 1.离在线是否可以完全离线使用?初次使用是否需要联网还是每次登陆程序开始都要联网?是否初次联网之后可以一直离线了,不用再联网了? 2.请问初次联网是为了数据包更新,还是检测各种key或者是因为什么其他原因? 3.离线授权申请需要多长时间,离线授权成功后有什么作用呢? 4.常用指令离线数据包,下载之后是否可以实现不联网,纯离线的效果,这个数据包下载下来如何使用呢? 大家可以随意回答,想回答哪个问题就回答那个问题,如果都回答当然最好了[图片] 回复lll112012: 1.离在线SDK,第一次进行联网授权后,可以进行离线使用(首次即可,不用每次,然后有3年有效期,到期后需要联网再更新即可继续使用) 2.第一次联网绑定APP ID 、设置AK SK 3.授权很快,授权成功后可以使用离线服务了 4.可以,指令包主要是用来设置唤醒的,比如您说停止,语音识别就停止了,响应您的指令。指令词就是一些常用的词语,您可以可以自己设置词库
1
唤醒和识别连续说
Ta的回复 :bibaboone: 我使用的服务是:离在线融合SDK安卓 唤醒+识别 调用的接口是:唤醒事件监听器 参数设置情况:keyword,vad,grammar,language 开发平台和机型:4.4.4 投影设备 SDK版本号:2.1.20 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 1、设置参数infile,是否只对识别有效?唤醒可以使用“数据源方法全名”吗?因为唤醒是后台一直运行的,mic会被一直占用,影响视频通话等第三方用mic的应用调用,能否把唤醒的音频源设置成“数据源方法全名”的? 2、唤醒和识别连续说,这个过程时间特别长,对配置低些的设备,需要5S以上才能响应完。一般唤醒后都会直接调用语音命令,能否在唤醒中加个识别的方法,让唤醒和语音衔接更快?或者唤醒后调用语音识别能否直接走识别的过程,而不走语音开始监听到停止监听的过程? 3、单独调用唤醒和单独调用识别的时间都特别快,当唤醒识别连续说时,是不是sdk内部会去停唤醒然后又去开启的识别才导致整个过程非常慢的? 回复bibaboone: 您好,收到您的提问,我们技术同学会再测试看看,您能否提供下APP ID?
5
语音合成
Ta的回复 :fz...e@163.com: 我想询问一下,android平台的语音合成,设置参数的: mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "9"); 这个音量对应android下的那个类型的音量,是系统音量、音乐音量还是其他类型的。 回复fz...e@163.com: 稍等我确认下答复您
2
原帖已删除
Ta的回复 :Leautolink: 我使用的服务是:android 合成和识别 调用的接口是: speechSynthesizer.speak(text); SDK版本号:com.baidu.tts_2.3.0.jar 复现步骤、现象及其他描述:播报文字"来自10086的短信ijjdkdjjkkekdmm"时,只会播报到第一个字母i,后面就停止了.用官方给出的demo测试也是这样. 回复Leautolink: 您好,收到您的疑问,我们进行技术测试后,答复您具体原因
0
请问怎样配置 Proguard 使导出时不混淆 sdk 的 jar 包?
Ta的回复 :语音电子书: 我使用的服务是:语音合成 调用的接口是: 参数设置情况: 开发平台和机型:android  SDK版本号:2.30 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 调试版播放正常,导出混淆版会闪退。 说明文档上说: 3.4 Proguard 配置 请不要混淆 sdk 的 jar 包。 配了一个晚上,jar包都还是被混淆了。代码如下: -libraryjars libs\galaxy-v2.0.jar -libraryjars libs\com.baidu.tts_2.3.0.jar -dontwarn    com.baidu.tts.* -keep class   com.baidu.tts.** { *;} -dontwarn    com.baidu.tts.auth.AuthInfo.* -keep class   com.baidu.tts.auth.AuthInfo.** { *;} -dontwarn    com.baidu.tts.client.SpeechError.* -keep class   com.baidu.tts.client.SpeechError.** { *;} -dontwarn    com.baidu.tts.client.SpeechSynthesizer.* -keep class   com.baidu.tts.client.SpeechSynthesizer.** { *;} -dontwarn    com.baidu.tts.client.SpeechSynthesizerListener.* -keep class   com.baidu.tts.client.SpeechSynthesizerListener.** { *;} -dontwarn    com.baidu.tts.client.SynthesizerTool.* -keep class   com.baidu.tts.client.SynthesizerTool.** { *;} -dontwarn    com.baidu.tts.client.TtsMode.* -keep class   com.baidu.tts.client.TtsMode.** { *;} 回复语音电子书: 您好,收到您的疑问,我们进行技术测试后,答复您具体原因
5
原帖已删除
Ta的回复 :春晖Android: 我使用的服务是:1 调用的接口是:语音合成 参数设置情况: 啊啊 开发平台和机型:a'a SDK版本号:a 代码或日志截图(上传截图能帮助您更快解决问题):aa 复现步骤、现象及其他描述:aa 回复春晖Android: 您好,收到您的疑问,我们看看有没有方法
0
离线语音识别,一开始监听就回调onError方法显示没有匹配的识别结果
Ta的回复 :儒雅的牛大春: 我使用的服务是:离线语音识别 调用的接口是:speechRecognizer.startListening(intent); 参数设置情况:intent.putExtra("grammar", "asset:///baidu_speech_grammar.bsg"); 开发平台和机型:Android 6.0,小米2S SDK版本号:2.1.21 代码或日志截图(上传截图能帮助您更快解决问题): public SpeechControl(Context context) { speechRecognizer = SpeechRecognizer.createSpeechRecognizer(context, new ComponentName(context, VoiceRecognitionService.class)); speechRecognizer.setRecognitionListener(this); } public void startRecognize(OnRecognizeListener listener) { this.mListener = listener; Intent intent = new Intent(); intent.putExtra("grammar", "asset:///baidu_speech_grammar.bsg"); speechRecognizer.startListening(intent); } @Override public void onReadyForSpeech(Bundle params) { Log.e("TAG", "准备就绪,可以开始说话"); } @Override public void onBeginningOfSpeech() { } @Override public void onRmsChanged(float rmsdB) { } @Override public void onBufferReceived(byte[] buffer) { } @Override public void onEndOfSpeech() { } @Override public void onError(int error) { StringBuilder sb = new StringBuilder(); switch (error) { case SpeechRecognizer.ERROR_AUDIO: sb.append("音频问题"); break; case SpeechRecognizer.ERROR_SPEECH_TIMEOUT: sb.append("没有语音输入"); break; case SpeechRecognizer.ERROR_CLIENT: sb.append("其它客户端错误"); break; case SpeechRecognizer.ERROR_INSUFFICIENT_PERMISSIONS: sb.append("权限不足"); break; case SpeechRecognizer.ERROR_NETWORK: sb.append("网络问题"); break; case SpeechRecognizer.ERROR_NO_MATCH: sb.append("没有匹配的识别结果"); break; case SpeechRecognizer.ERROR_RECOGNIZER_BUSY: sb.append("引擎忙"); break; case SpeechRecognizer.ERROR_SERVER: sb.append("服务端错误"); break; case SpeechRecognizer.ERROR_NETWORK_TIMEOUT: sb.append("连接超时"); break; } sb.append(":" + error); Log.e("TAG", "识别失败:" + sb.toString()); } @Override public void onResults(Bundle results) { ArrayList<String> resultList = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); String resultStr = Arrays.toString(resultList.toArray(new String[resultList.size()])); mListener.onResult(resultStr); } //识别临时结果 @Override public void onPartialResults(Bundle partialResults) { ArrayList<String> resultList = partialResults.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); String resultStr = Arrays.toString(resultList.toArray(new String[resultList.size()])); mListener.onResult(resultStr); } @Override public void onEvent(int eventType, Bundle params) { } public interface OnRecognizeListener { void onResult(String result); } 复现步骤、现象及其他描述:代码跟给出的demo是一样的,但是启动之后也不提示准备就绪,直接就执行onError返回没有匹配的识别结果。 回复儒雅的牛大春: 您好,您第一次进行联网授权了吗? 请到 http://yuyin.baidu.com/docs/asr/166核对程序中设置和应用是否一致(如api key和sercret key),然后您第一次联网设置授权
1
ios的离在线语音合成,有网络情况下拿到的合成语音文件出错,在无网络时正常!
Ta的回复 :123xiao951: 我使用的服务是:语音合成 调用的接口是: - (void)synthesizerNewDataArrived:(NSData *)newData                        DataFormat:(BDSAudioFormat)fmt                    characterCount:(int)newLength                    sentenceNumber:(NSInteger)SynthesizeSentence; 参数设置情况: 开发平台和机型: SDK版本号:2.2.2 代码或日志截图(上传截图能帮助您更快解决问题): [图片] 复现步骤、现象及其他描述: 用以上同样代码,在无网络情况下,把返回的数据拼接后能正常播放,但是在有网络的情况下,播放却全是电流声(说明数据拼接出错了),这该怎么解决呢? 回复123xiao951: 您好,收到您的疑问,我们进行技术测试后,答复您具体原因
2
百度语音合成,获取服务器可用的引擎模型信息(比如男女声中英文发音)一直返回为空
Ta的回复 :小宏WHY: 我使用的服务是:百度语音合成,获取服务器可用的引擎模型信息(比如男女声中英文发音) 调用的接口是: AvailableConditions conditions = new AvailableConditions(); conditions.appendGender("female"); conditions.appendSpeaker("f7"); //获取服务器的可用的所有模型信息 BasicHandler<ModelBags> handler = mModelManager.getServerModelsAvailable(conditions); 参数设置情况: conditions.appendGender("female"); conditions.appendSpeaker("f7"); 开发平台和机型:android平台,华为手机 SDK版本号:com.baidu.tts_2.3.0 代码或日志截图(上传截图能帮助您更快解决问题):代码如上 复现步骤、现象及其他描述: 1.实现功能: 通过sdk接口查询服务器可用的引擎模型信息(比如男女声中英文发音),下载到本地,并设置语音加载路径,实现离在线播报功能。 2.问题: 通过以上的代码,在一些手机上 ModelBags bags = handler.get(); 返回是空的,比如这款设备:[图片]。其他大部分手机是可以正常返回数据的。请问这是什么原因? 回复小宏WHY: 您好,收到您的疑问,我们进行技术测试后,答复您具体原因
2
iOS语音合成SDK有用到热修复相关的方法吗?
Ta的回复 :骁哥i: 收到苹果官方发送的警告邮件,请问贵公司iOS语音合成SDK有用到热修复相关的方法吗? 回复骁哥i: 您好,收到您的疑问,我们进行技术测试后,答复您具体原因
2
离线状态下,只有一种女声吗,那4种男女声只能在在线状态下用?
Ta的回复 :op...n@readingjoy.com: 我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 回复op...n@readingjoy.com: 您好,您可以进行设置相关的参数。详细文档:http://ai.baidu.com/docs#/TTS-Android-SDK/top [图片]
1
原帖已删除
Ta的回复 :hw198324: 我使用的服务是: 调用的接口是:mWpEventManager.registerListener 参数设置情况:报错了 还没设置 开发平台和机型:MTK6735 SDK版本号:android 5.1 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 回复hw198324: 参考文档:http://ai.baidu.com/docs#/ASR-Android-SDK/top;另外,您百度上查找下LOCAL_JNI_SHARED_LIBRARIES。这个今天在语音QQ交流群(127072371)也有人问到,按照这个方法进行优化的,有问题您再随时说
0
网络问题
Ta的回复 :ddsf123: 我使用的服务是:语音合成 调用的接口是:RESTAPI 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述:返回给我的语音在线地址是tts.baidu.com/xxxxxxxxxx,我们这边是教育网,没法直接访问百度,但是如果知道IP可以申请开通网络权限,请问你们有固定IP吗 回复ddsf123: 您好,你可以使用离在线SDK服务,这样就可以实现离线状态的识别了
1
【授权相关】请问我可以这么使用百度广播开放平台么?
Ta的回复 :阿撒托斯要吃糖: http://developer.baidu.com/vcast 即你们的此链接产品 我想在浏览器中加入文字转换语音的功能(用户看不到,在app内部直接跳转在线使用该页面), 但是转换合成过程中标注正在使用【百度广播开放平台】 并在app中声明所有语音合成技术及音色库均来自【百度语音】旗下产品 请问可以么? 回复阿撒托斯要吃糖: 您好,感谢您关注和使用我们,这个我们内部确认下,跟您具体联系,您也可以在ai.baidu.com右侧蓝色信箱小图标,填写相应信息,我们直接电话或者邮件联系[图片]
14
&quot;desc&quot;:&quot;java.lang.Exception: WakeUpInitial=-1&quot;
Ta的回复 :ice849: 我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 1.APP_ID API_KEY SECRET_KEY都填写修改了 2.管理包名也填写了 回复ice849: 怀疑您这个问题是在线引擎授权失败,您添加APP ID,设置AKSK后,需要第一次进行联网授权,授权后,就可以使用服务了
1
android 离线tts合成报错
Ta的回复 :碘嚼涩讥: 我使用的服务是:Android tts离线合成 调用的接口是:.speak(“”) 参数设置情况: 开发平台和机型: SDK版本号:2.3.0 代码或日志截图(上传截图能帮助您更快解决问题):报错offline engine synthesize result not 0[(11)]--utteranceId=0 复现步骤、现象及其他描述:离线就报错offline engine synthesize result not 0[(11)]--utteranceId=0 回复碘嚼涩讥: 您好,您先查看下是否绑定了包名、设置了AK SK?
3
unity使用百度语音TTS,报错::由于套接字没有连接并且(当使用一个 sendto 调用发送数据报套接字时)没有提供地址,发送或接收数据的请求没有被接受。
Ta的回复 :jiutian1990: 在unity3D 5.5.1p版本中是用百度语音,先在Asset--StreamingAssets文件夹中添加SocketServer_TTS.exe。 但是遇到了非常棘手的问题,同一个工程文件,在win7 上能够完美运行,但是在win10上就报错。报错::由于套接字没有连接并且(当使用一个 sendto 调用发送数据报套接字时)没有提供地址,发送或接收数据的请求没有被接受。 控制台报错:80004005。[图片][图片] 问了度娘之后,网友说win10缺少DLL文件。 按照网友的办法设置后,并没有什么卵用。 急急急~~~ 跪谢~~~ 回复jiutian1990: 您好,收到您的疑问,稍后技术查看后,给您详细答复
3
调用语音排队合成后,无法完整朗读,还没有朗读完整就到了下一个,下一个也是,该怎么办?
Ta的回复 :浪子晨荒诞不经: List<SpeechSynthesizeBag> bags = new ArrayList<SpeechSynthesizeBag>(); //我循环的增加了bags里面的对象 bags.add(getSpeechSynthesizeBag(speekInfo,i+""));speak(); private void speak() {//需要合成的文本text的长度不能超过1024个GBK字节。        /*text = "欢迎使用百度语音合成SDK,百度语音为你提供支持。";*/    int results = 0;        results = this.mSpeechSynthesizer.batchSpeak(bags);    if (results < 0) {    } } 回复浪子晨荒诞不经: 您好,收到您的疑问,稍后技术查看后,给您详细答复
6
切换版块
智能客服