开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语言处理技术

    常见问题

    Q:自然语言处理能力是否支持英文或其他外文?
    A:因训练语料大多为中文,故目前在中文领域内效果较好,英文或其他外文暂不支持。

    Q:输入编码是什么?
    A:目前仅支持输入GBK编码,需要您在输入前进行转码处理。

    Q:词法分析结果中的词性标注都是什么含义?
    A:详见下表,具体请参考API文档。

    词性 含义 词性 含义 词性 含义 词性 含义
    n 普通名词 f 方位名词 s 处所名词 t 时间名词
    nr 人名 ns 地名 nt 机构团体名 nw 作品名
    nz 其他专名 v 普通动词 vd 动副词 vn 名动词
    a 形容词 ad 副动词 an 名形词 d 副词
    m 数量词 q 量词 r 代词 p 介词
    c 连词 u 助词 xc 其他虚词 w 标点符号

    Q:依存句法关系标签有哪些?

    A:我们可分析34种句法依存关系,详细介绍请参考API文档。

    1. 定中关系ATT
    2. 数量关系QUN(quantity)
    3. 并列关系COO(coordinate)
    4. 同位关系APP(appositive)
    5. 附加关系ADJ(adjunct)
    6. 动宾关系VOB(verb-object)
    7. 介宾关系POB(preposition-object)
    8. 主谓关系SBV(subject-verb)
    9. 比拟关系SIM(similarity)
    10. 时间关系TMP(temporal)
    11. 处所关系LOC(locative)
    12. “的”字结构DE
    13. “地”字结构DI
    14. “得”字结构DEI
    15. “所”字结构SUO
    16. “把”字结构BA
    17. “被”字结构BEI
    18. 状中结构ADV(adverbial)
    19. 动补结构CMP(complement)
    20. 兼语结构DBL(double)
    21. 关联词CNJ(conjunction)
    22. 关联结构 CS(conjunctive structure)
    23. 语态结构MT(mood-tense)
    24. 连谓结构VV(verb-verb)
    25. 核心HED(head)
    26. 前置宾语FOB(fronting object)
    27. 双宾语DOB(double object)
    28. 主题TOP(topic)
    29. 独立结构IS(independent structure)
    30. 独立分句IC(independent clause)
    31. 依存分句DC(dependent clause)
    32. 叠词关系VNV (verb-no-verb or verb-one-verb)
    33. 一个词YGC
    34. 标点 WP

    Q:词向量表示具备多少维度?
    A:我们提供1024维的词向量表示,后续版本会考虑提供降维版本以适用于不同场景。

    Q:中文DNN语言模型对文本个数有什么限制?输入编码是什么?
    A:最大长度256字节,大约为128个汉字,支持GBK编码输入,不需要切词。

    Q:中文DNN语言模型中英文混杂怎么办?
    A:模型词表中包含常用高频英文单词,也可以进行匹配。

    Q:为什么很多词的词义相似度都是1?
    A:尽管词向量的词表在百万量级,但仍有可能出现不在词表中的词,不在词表中的词统一映射到OOV(out-of-vocabulary)中,所以当词对中的两个词都是OOV的时候,相似度为1。

    Q:短文本相似度对文字字数有什么限制?
    A:最大长度512字节,大约为266个汉字,但字数过多或过少会对效果略有影响。

    Q:短文本相似度计算,中英文混杂怎么办?
    A:模型词表中包含常用高频英文单词,对中文语境中的“中英混排”文本可以很好的进行匹配。

    Q:为什么有时短文本相似度计算没有返回结果?
    A:有结果返回的前提条件是文本中的单词被词表收录,尽管模型词表很大(百万级),但仍然偶尔会出现不在词表的问题,当文本所有单词都不在词表中的时候,会得不到结果。

    Q:评论观点抽取对输入的评论长度有限制么?
    A:最大长度10240字节,大约为5120个汉字。

    Q:评论观点抽取可以标记挖掘出观点的文本位置吗?
    A:可以的,输出结果中包含观点标签在原始文本中的位置。例如可以标记出:这家旅店服务还是不错的。

    Q:评论观点抽取支持自定义词典上传吗?
    A:评论观点抽取定制版已于2018.7月正式开放,可支持用户自行上传扩展13个垂类的表述观点词表内容,以保证定义和抽取更丰富的评论内容,具体可参见官网文档介绍与功能介绍。

    Q:评论观点抽取可以批量上传并总结好标签及个数吗?
    A:可以利用接口实现该功能。接口可以实现对每个评论的评论观点标签抽取和极性分析,多次调用即可实现多评论的标签挖掘和分析。

    Q:情感倾向分析可以分析哪些情感类型?
    A:目前分析的情感极性分为积极、消极、中性。

    Q:情感倾向分析与对话情绪识别有何差异?
    A:对话情绪识别是对用户对话场景下的语言是正向/中性/负向(如:你好厉害啊/烦死啦)的一种直观检测,而情感分析更倾向于分析对某个客体(如:电影、书籍)所表达出来的喜好/讨厌程度,两者在对应场景下的效果最优,否则将会一定程度影响识别准确率。

    更多问题,这里交流:https://ai.baidu.com/forum/topic/list/169

    上一篇
    语言处理应用技术
    下一篇
    错误码说明