整体介绍
简介
Hi,您好,欢迎使用百度UNIT私有化部署产品。
UNIT私有化部署方案是基于UNIT对话模型封装而成的能够本地化部署的纯软件方案,将软件包部署在本地服务器或专有云服务器上后,启动服务,即可调用与在线API功能基本完全相同的接口(参数有少量区别,具体说明请参考接口调用文档)。
目前UNIT私有化部署方案已经支持平台整体私有化、技能模型私有化等,能够更好地满足客户,更加快速、灵活、低成本地响应私有化部署需求,在保证客户数据安全和数据私密性的同时助力打造更加智能的对话系统。
以下将为您介绍开发者如何针对技能模型私有化在平台上自行操作进行私有化部署,如需要平台其他功能模块(如Taskflow等)或需要平台整体私有化,请联系客户经理/工作人员沟通。
方案概述
私有化部署方案适用于网络环境受限制(例如专网)或者对数据私密性有要求的各类业务场景,如公共安防、园区管理、校园监控等,提供分布式高并发部署方案,纯软件方案可以快速测试、快速交付,且不与硬件进行捆绑,更高效、灵活。
注:百度为开发者提供的是包含对话技能和问答技能模型的部署包软件,硬件采购和服务器部署请提前准备,服务器配置推荐请参考下文软硬件配置部分。
技能模型私有化部署的整体业务流程分为申请应用和购买应用两种,更好地满足开发者试用及购买的需求,如下图,下文将针对各个环节分别说明。
申请应用:
购买应用:
产品功能
-
对话技能:
- 对话技能在多轮对话中可以准确理解用户需求(意图)和实现需求的关键信息(词槽),适用于需要根据不同对话意图和词槽信息给出不同对话答复的对话场景。能够在一些特定的对话场景下高精准地理解并满足用户需求,提升用户体验和满意度。比如问天气技能、订火车票技能、听音乐技能等等。
-
问答技能:
- 问答技能适用于问题问法多样,但答案相对固定的对话场景,不需要根据用户对话话语中的关键信息来设定不同的答复内容。比如针对各种规则制度、政策法规等信息的问答技能。
购买指南
UNIT私有化部署方案为付费产品,可自用或集成为客户使用,需具备基本的IT能力进行部署使用。
- 正式购买:按照授权数量计费(具体授权方式见下文授权说明),不同功能的部署包分别计费,具体价格请联系客户经理/工作人员沟通。
软硬件配置
1. 鉴权服务软硬件要求
硬件要求(物理机)
- CPU架构:AMD 64/x86_64
- 内存:>=32G(推荐,不强制)
- 硬盘:>=512G (推荐)
- 网络环境:机器需要在局域网内,且能获取到ip地址
操作系统要求
- 基于安全的角度,暂时不支持虚拟机部署,包括但不限于Virtual Box、VMware等
-
支持的Linux发行版列表
- Ubuntu: 14、16、18
- CentOS:7.0及以上
- RedHat:7.2
- SUSE 12
- Linux内核要求 >=3.10
- GLIBC >=2.17
- GLIBCXX >=3.4.19
- Python 2.7
2. 应用服务软硬件要求
- 只有对话服务,无训练服务
环境类别 | 环境需求 |
---|---|
硬件要求 | 支持物理机、虚拟机部署方式; CPU架构:AMD 64/x86_64;内存: >=48G;主板主频>1833mHZ;硬盘:>=512G(应用服务安装目录磁盘空间>100G);机器需要在局域网内,且能获取到ip地址 |
操作系统(64位) | CentOS 7、Ubuntu 14/16/18、RedHat7.2 |
网络环境 | 有线局域网,不支持无线网络 |
服务端口 | 请参考接口调用文档 |
性能指标
机器配置 | 内存占用 | QPS | 平均响应时间 | 说明 |
---|---|---|---|---|
8核64G内存虚拟机 | 27G-40G | 50-100 | 150ms-200ms | 压测环境说明:压测并发数为10,部署方式为单技能单实例部署,技能类型为对话技能性能指标说明: a.内存占用与私有化技能个数、每个技能的模型大小成正比 b.QPS与机器CPU核数有关,如果私有化多个技能,多个技能共享机器CPU资源 |
注:以上性能指标仅供参考,具体应用中以项目实测为准
如何接入
注:仅支持2020年6月15号之后训练的模型,如果您的模型训练时间早于2020年6月15号,需要您重新训练模型后才能顺利申请私有化部署包。
1、申请或购买
在UNIT平台的用户中心里,进行应用申请或购买应用。若是应用申请方式,提交申请后,工作人员会在后台进行审核,同时可联系您的AM询问审核进度。若是购买应用方式,在平台上完成订单付款后即可。
2、下载获取部署包
部署包申请审批通过或完成订单购买后,您会得到部署包的下载链接,需要经过以下步骤,得到可运行的部署包。
- 通过下载链接下载安装文件到本地
- 在本地执行命令下载模型部署包
通过下载链接下载安装文件到本地
由于私有化环境下最终进行应用部署的服务器不能连接外网,您需要先选择一台可以联网的电脑或服务器进行鉴权服务安装包及镜像文件安装包的下载。您可选择Windows、Linux、MacOS操作系统来进行鉴权服务部署包的下载。
下载完成后您可自行将安装包上传到需要进行私有化部署的服务器上。
在本地执行命令下载部署包
下载完成安装文件后,解压后进入original目录执行以下命令获取到部署包。
- linux/macos环境:
执行bash download.sh
- windows环境:
首先需要下载win-bash,使windows环境可以执行linux脚本。
win-bash的下载地址为:https://sourceforge.net/projects/win-bash/files/shell-complete/latest/
解压后放在original目录下,目录结构如下图所示
最后点击download.bat
执行下载脚本,下载安装包。
最终得到的部署包,包含以下内容:鉴权服务安装包、应用镜像文件安装包以及docker安装包等基础依赖环境。
备注:进入original目录后可打开refs.txt文件查看详细的下载内容。
CPU环境部署和GPU环境部署下载后包含的的安装文件有所区别。具体示例如下:
注:问答技能和对话技能使用CPU机器即可
授权说明
私有化方案需要对服务器硬件进行授权,您可以在GPU服务器或者普通PC物理机上运行百度提供的硬件指纹提取工具,提取硬件信息(提取成功后会生成一个指纹文件),然后在UNIT平台私有化部署包申请或购买界面上传指纹文件,审批通过后即可获得授权。
将运行UNIT对话模型的机器与运行授权服务的硬件间建立通信,就能运行起UNIT对话模型了,可运行模型的显卡数量与授权数量相同。
授权有效期
UNIT自授权当日起三年内,提供包括部署包升级,部署包下载在内的技术支持;超过三年后,需要额外付费;
注:平台提供三年的技术支持,但私有化部署包下载到本地后,开发者可以一直使用,有效期至2050年1月1号;
具体费用信息请联系客户经理/工作人员沟通。
服务部署
部署环境准备、部署方式、部署流程(含鉴权服务和应用服务)详见部署说明文档。
接口调用
应用服务部署成功后,即可获得与在线API基本完全相同的接口,可参考接口调用文档开始调用测试。