开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

常见问题

Q:自然语言处理能力是否支持英文或其他外文?
A:因训练语料大多为中文,故目前在中文领域内效果较好,英文或其他外文暂不支持。

Q:输入编码是什么?
A:目前支持输入GBK编码和UTF-8编码。

Q:词法分析结果中的词性标注都是什么含义?
A:详见下表,具体请参考API文档。

词性 含义 词性 含义 词性 含义 词性 含义
n 普通名词 f 方位名词 s 处所名词 t 时间名词
nr 人名 ns 地名 nt 机构团体名 nw 作品名
nz 其他专名 v 普通动词 vd 动副词 vn 名动词
a 形容词 ad 副动词 an 名形词 d 副词
m 数量词 q 量词 r 代词 p 介词
c 连词 u 助词 xc 其他虚词 w 标点符号

Q:依存句法关系标签有哪些?

A:我们可分析34种句法依存关系,详细介绍请参考API文档。

  1. 定中关系ATT
  2. 数量关系QUN(quantity)
  3. 并列关系COO(coordinate)
  4. 同位关系APP(appositive)
  5. 附加关系ADJ(adjunct)
  6. 动宾关系VOB(verb-object)
  7. 介宾关系POB(preposition-object)
  8. 主谓关系SBV(subject-verb)
  9. 比拟关系SIM(similarity)
  10. 时间关系TMP(temporal)
  11. 处所关系LOC(locative)
  12. “的”字结构DE
  13. “地”字结构DI
  14. “得”字结构DEI
  15. “所”字结构SUO
  16. “把”字结构BA
  17. “被”字结构BEI
  18. 状中结构ADV(adverbial)
  19. 动补结构CMP(complement)
  20. 兼语结构DBL(double)
  21. 关联词CNJ(conjunction)
  22. 关联结构 CS(conjunctive structure)
  23. 语态结构MT(mood-tense)
  24. 连谓结构VV(verb-verb)
  25. 核心HED(head)
  26. 前置宾语FOB(fronting object)
  27. 双宾语DOB(double object)
  28. 主题TOP(topic)
  29. 独立结构IS(independent structure)
  30. 独立分句IC(independent clause)
  31. 依存分句DC(dependent clause)
  32. 叠词关系VNV (verb-no-verb or verb-one-verb)
  33. 一个词YGC
  34. 标点 WP

Q:词向量表示具备多少维度?
A:我们提供1024维的词向量表示,后续版本会考虑提供降维版本以适用于不同场景。

Q:中文DNN语言模型对文本个数有什么限制?输入编码是什么?
A:最大长度256字节,大约为128个汉字,支持GBK编码输入,不需要切词。

Q:中文DNN语言模型中英文混杂怎么办?
A:模型词表中包含常用高频英文单词,也可以进行匹配。

Q:为什么很多词的词义相似度都是1?
A:尽管词向量的词表在百万量级,但仍有可能出现不在词表中的词,不在词表中的词统一映射到OOV(out-of-vocabulary)中,所以当词对中的两个词都是OOV的时候,相似度为1。

Q:短文本相似度对文字字数有什么限制?
A:最大长度512字节,大约为266个汉字,但字数过多或过少会对效果略有影响。

Q:短文本相似度计算,中英文混杂怎么办?
A:模型词表中包含常用高频英文单词,对中文语境中的“中英混排”文本可以很好的进行匹配。

Q:为什么有时短文本相似度计算没有返回结果?
A:有结果返回的前提条件是文本中的单词被词表收录,尽管模型词表很大(百万级),但仍然偶尔会出现不在词表的问题,当文本所有单词都不在词表中的时候,会得不到结果。

Q:评论观点抽取对输入的评论长度有限制么?
A:最大长度10240字节,大约为5120个汉字。

Q:评论观点抽取可以标记挖掘出观点的文本位置吗?
A:可以的,输出结果中包含观点标签在原始文本中的位置。例如可以标记出:这家旅店服务还是不错的。

Q:评论观点抽取支持自定义词典上传吗?
A:评论观点抽取定制版已于2018.7月正式开放,可支持用户自行上传扩展13个垂类的表述观点词表内容,以保证定义和抽取更丰富的评论内容,具体可参见官网文档介绍与功能介绍。

Q:评论观点抽取可以批量上传并总结好标签及个数吗?
A:可以利用接口实现该功能。接口可以实现对每个评论的评论观点标签抽取和极性分析,多次调用即可实现多评论的标签挖掘和分析。

Q:情感倾向分析可以分析哪些情感类型?
A:目前分析的情感极性分为积极、消极、中性。

Q:情感倾向分析与对话情绪识别有何差异?
A:对话情绪识别是对用户对话场景下的语言是正向/中性/负向(如:你好厉害啊/烦死啦)的一种直观检测,而情感分析更倾向于分析对某个客体(如:电影、书籍)所表达出来的喜好/讨厌程度,两者在对应场景下的效果最优,否则将会一定程度影响识别准确率。

更多问题,这里交流:https://ai.baidu.com/forum/topic/list/169

上一篇
语言生成技术
下一篇
错误码说明