声音与形象
更新时间:2025-04-08
开启「声音和形象」配置开关,选择与应用设定匹配的语音播报音色或数字人声音形象,可在「预览与调试」界面查看效果。
数字人播报
数字人播报可用于企业宣传片、产品介绍、虚拟客服等场景,通过数字人形象和声音进行信息传达,具有较强的视觉吸引力和表现力。可点击“全部形象”预览公共形象库,并为数字人形象配备合适的音色。
定制形象
平台赠送每个用户三次免费照片克隆额度,只需上传照片即可分钟级完成专属数字人形象的克隆,克隆大约需要5分钟的时间,克隆完成后我们将通过短信的方式通知您。如需获取更多额度,可前往购买
注意:如您的定制形象无法正常显示,请检查浏览器设置,确定已开启图形加速功能
分发渠道
兼容性
数字人播报受浏览器版本和手机型号影响,可能会存在无法播报的情况,建议使用Chrome126及以上版本浏览器、Edge126及以上版本浏览器,Safari15.6.1及以上版本浏览器,ios16.1及以上系统,Android13及以上系统。
语音播报
语音播报可用于对视觉要求不高,但需要快速传达信息的场景,如新闻播报、有声读物、语音助手、导航提示等。通过声音进行信息传达,注重听觉体验和信息的快速传达。点击“声音”下拉框可试听多种音色。
自动播报
a. 开启【自动播报】,将会自动播报系统输出内容。
b. 关闭【自动播报】,将不会自动播报系统输出内容,可以通过点击【开始播报】按钮,手动控制播报内容。
c. 点击【开始播报】后,再点击本条内容的【停止播报】,将会停止播报。
语音通话
通过语音通话功能,用户可体验沉浸式电话交互(当前仅限网页版渠道)。支持实时字幕与语音打断能力,适用于即时性强的对话场景,例如沉浸式语音陪伴、游戏化对话体验、语音客服咨询等。
启用方式
- 开启 语音互动-【语音通话】开关,在应用预览与调试/应用体验页面,点击右上角【语音通话】按钮即可接入。
- 勾选【设为默认交互方式】,用户访问应用时将默认进入语音模式。
- 开启【实时字幕】支持通话内容实时文字转译。
- 开启【实时打断】用户可随时中断语音回复发起新提问。
功能特性
- 配置更新需挂断重拨后生效。
- 通话保护机制:无语音输入超过5分钟自动挂断,单次通话超过2小时自动结束。
- 推荐使用快思考模型,减少挂载组件数量,以提升响应速度。
- 应用终止回复/关联卡片类组件可能导致语音播报异常。
- 当前数字人互动暂不支持语音通话。