【语音月】语音合成升级人群流量监控方案
才能我浪费99 发布于2019-11-08 浏览:1448 回复:11
2
收藏
最后编辑于2019-12-03

1.功能描述:

语音合成:基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性

2.特色优势

支持多语言多音色
支持中文、英文、中英文混读合成,提供基础音库和精品音库共9种发音人供您选择,让您的应用拥有个性化的声音

丰富的场景应用
支持纯在线、纯离线、离在线融合三种应用方式,支持在有网、无网、弱网环境下的合成播报,满足不同的场景需求

方便快捷的集成方式
提供REST API接口,方便可发起网络请求的设备进行合成;提供Android、iOS SDK,轻巧简便,便于手机、智能硬件快速集成

3.调用攻略(Python3)及评测

3.1API(Python)说明:
请严格按照文档里描述的参数进行开发。请注意以下几个问题:
1.合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。切忌文本长度超过限制。
2.新创建语音合成应用不限制每日调用量,但有QPS限额。详细限额数据可在控制台中查看。完成个人实名认证及企业认证可提高QPS限额。若需更大QPS可进一步商务合作咨询。
3.必填字段中,严格按照文档描述中内容填写。

配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:

接口 说明
setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)


3.2 接口说明
语音合成接口描述
基于该接口,开发者可以轻松的获取语音合成能力

输入参数:


返回样例:

// 成功返回二进制文件流
// 失败返回
{
"err_no":500,
"err_msg":"notsupport.",
"sn":"abcdefgh",
"idx":1
}
错误信息
若请求错误,服务器将返回的JSON文本包含以下参数:

error_code:错误码。
error_msg:错误描述信息,帮助理解和解决发生的错误。

错误码 含义
500 不支持的输入
501 输入参数不正确
502 token验证失败
503 合成后端错误


3.3 代码实现

Python3调用代码如下:

from aip import AipSpeech

APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

def doc2speech(content,resultfile):
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    result  = client.synthesis(content, 'zh', 1, {
        'vol': 5,
    })
    
    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码
    if not isinstance(result, dict):
        with open(resultfile, 'wb') as f:
            f.write(result)

doc2speech('测试百度语音功能','../voc/voc1.mp3')


4.功能评测

选用不同的数据对效果进行测试,发现生成速度很快,效果很好。可以应用于:
泛阅读:通过阅读类APP阅读小说或新闻时,使用语音合成技术为用户提供多种发音人的朗读功能,释放双手和双眼,获得更极致的阅读体验
订单播报:可应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成进行订单播报,让您便捷获得通知信息
智能硬件:可集成到儿童故事机、智能机器人、平板设备等智能硬件设备,使用户与设备的交互更自然、更亲切
等场景。

5 应用案例

应用语音合成功能对我以前写的人群流量方案进行升级,原文章链接如下:
https://ai.baidu.com/forum/topic/show/953160
原方案在发现过于拥挤后生成警告信息发给工作人员,由工作人员来进行疏散,需要比较长的时间周期。升级后直接对于过于拥挤的时候,除了发布警告信息给工作人员之外,还通过语音合成生成警告信息,通过园区的广播,直接指导人们离开过于拥挤的地方,降低危险性。

修改后的方案如图所示:

例如对于案例中,设置的是:区域1一个人也不应该有(因为禁止游泳),区域2报警阈值650,区域3报警阈值200.

那么在分析后就会触发针对区域2的报警广播,“附近人员过多,最大650人,现已733人,请启动限流疏散措施”。

收藏
点赞
2
个赞
共11条回复 最后由才能我浪费99回复于2019-12-03
#12才能我浪费99回复于2019-12-03
#9 worddict回复
图像+语音全智能服务

自动识别,自动告警

0
#11才能我浪费99回复于2019-12-03
#5 小雨青青润无声回复
这次的案例真的很实用

是啊,这就是针对实际问题设计的

0
#10worddict回复于2019-11-25

百度的功能的确强大

0
#9worddict回复于2019-11-25

图像+语音全智能服务

0
#8worddict回复于2019-11-25
#6 风搅火回复
公共预警以后的应用会很广

未来可以智能预警了

0
#7风搅火回复于2019-11-21

智能城市对我们的生活越来越重要了

0
#6风搅火回复于2019-11-21

公共预警以后的应用会很广

0
#5小雨青青润无声回复于2019-11-21

这次的案例真的很实用

0
#4小雨青青润无声回复于2019-11-21

又有新的作品发表了,赞

0
#3才能我浪费99回复于2019-11-18
#2 134******14回复
我给你点个赞

谢谢哈

0
#2134******14回复于2019-11-11

我给你点个赞

0
TOP
切换版块