【产品建议】【语言处理】情感倾向分析攻略、评测

首页版块访问AI主站注册发帖

才能我浪费99 发布于2019-04 浏览:6361 回复:21

【产品建议】【语言处理】情感倾向分析攻略、评测

快速回复

最后编辑于2022-04

调用攻略（Python3）

首先认证授权：

在开始调用任何API之前需要先进行认证授权，具体的说明请参考：

http://ai.baidu.com/docs#/Auth/top

获取Access Token

向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求（推荐使用POST），并在URL中带上以下参数：

grant_type：?必须参数，固定为client_credentials；
client_id：?必须参数，应用的API Key；
client_secret：?必须参数，应用的Secret Key；
例如：

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=Va5yQRHlA4Fq5eR3LT0vuXV4&client_secret=0rDSjzQ20XUj5itV6WRtznPQSzr5pVw2&

具体Python3代码如下：

# -*- coding: utf-8 -*-
#!/usr/bin/env python

import urllib
import json
#client_id 为官网获取的AK， client_secret 为官网获取的SK
client_id =【百度云应用的AK】
client_secret =【百度云应用的SK】

#获取token
def get_token():
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
    request = urllib.request.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib.request.urlopen(request)
    token_content = response.read()
    if token_content:
        token_info = json.loads(token_content)
        token_key = token_info['access_token']
    return token_key

情感倾向分析接口调用：
详细说明请参考：http://ai.baidu.com/docs#/NLP-API/57b9b630

接口描述
情感倾向分析接口（通用版）：自动对包含主观信息的文本进行情感倾向性判断（积极、消极、中性），并给出相应的置信度。为口碑分析、话题监控、舆情分析等应用提供基础技术支持，同时支持用户自行定制模型效果调优。

请求说明
HTTP方法: POST
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/sentiment_classify

URL参数：
参数值
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：
参数值
Content-Type application/json

Body请求示例:
{
"text": "苹果是一家伟大的公司"
}

请求参数
参数类型描述是否必填
text string 文本内容，最大2048字节

返回说明
参数说明描述
log_id uint64 请求唯一标识码
sentiment int 表示情感极性分类结果，0:负向，1:中性，2:正向
confidence float 表示分类的置信度，取值范围[0,1]
positive_prob float 表示属于积极类别的概率，取值范围[0,1]
negative_prob float 表示属于消极类别的概率，取值范围[0,1]

Python3调用代码如下：

#调用情感分类接口        
def get_classify(content):
    print (content)
    token=get_token()
    url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/sentiment_classify'
    params = dict()
    params['text'] = content
    params = json.dumps(params).encode('utf-8')
    access_token = token
    url = url + "?access_token=" + access_token
    request = urllib.request.Request(url=url, data=params)
    request.add_header('Content-Type', 'application/json')
    response = urllib.request.urlopen(request)
    content = response.read()
    if content:
        content=content.decode('gb2312')
        #print (content)
        data = json.loads(content)
        data=data['items'][0]
        sentiment=data['sentiment']
        if sentiment==0:
            sentiment='负向'
        elif sentiment==1:
            sentiment='中性'
        else:
            sentiment='正向'
        
        print ('情感分类结果：',sentiment)
        print ('分类的置信度：',data['confidence'])
        print ('积极类别概率：',data['positive_prob'])
        print ('消极类别概率：',data['negative_prob'])

功能评测：
选用不同的数据对情感分类的准确性进行测试，具体的案例包括生活用语，文章，古诗等。具体案例如下：

test_list = [
            '今天真开心啊。',
            '最近事情太多了，好烦啊。',
            '会当凌绝顶，一览众山小。',
            '枯藤老树昏鸦，小桥流水人家，古道西风瘦马。夕阳西下，断肠人在天涯。',
            '随着大数据应用者的规模越来越大，人工智能越来越成为一种主流',
            '让我们团结一心。',
            '你早上来晚了，他有点不高兴。',
            '项目马上就要成功了！',
            '你怎么不早点来啊！',
            '祝你生日快乐！']
        
import datetime
print (datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
for text in test_list:
    get_classify(text)
print (datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))

结果：
2019-04-17 10:27:04
今天真开心啊。
情感分类结果：正向
分类的置信度： 0.150197
积极类别概率： 0.617589
消极类别概率： 0.382411
最近事情太多了，好烦啊。
情感分类结果：中性
分类的置信度： 0.738756
积极类别概率： 0.513062
消极类别概率： 0.486938
会当凌绝顶，一览众山小。
情感分类结果：正向
分类的置信度： 0.0787282
积极类别概率： 0.585428
消极类别概率： 0.414572
枯藤老树昏鸦，小桥流水人家，古道西风瘦马。夕阳西下，断肠人在天涯。
情感分类结果：正向
分类的置信度： 0.281931
积极类别概率： 0.676869
消极类别概率： 0.323131
随着大数据应用者的规模越来越大，人工智能越来越成为一种主流
情感分类结果：正向
分类的置信度： 0.326132
积极类别概率： 0.696759
消极类别概率： 0.303241
让我们团结一心。
情感分类结果：正向
分类的置信度： 0.0150585
积极类别概率： 0.556776
消极类别概率： 0.443224
你早上来晚了，他有点不高兴。
情感分类结果：负向
分类的置信度： 0.286418
积极类别概率： 0.321112
消极类别概率： 0.678888
项目马上就要成功了！
情感分类结果：正向
分类的置信度： 0.331586
积极类别概率： 0.699214
消极类别概率： 0.300786
你怎么不早点来啊！
情感分类结果：负向
分类的置信度： 0.638268
积极类别概率： 0.16278
消极类别概率： 0.83722
祝你生日快乐！
情感分类结果：正向
分类的置信度： 0.0883195
积极类别概率： 0.589744
消极类别概率： 0.410256
2019-04-17 10:27:11

发现在10个测试案例中，有2个结果待商榷，分别是：
最近事情太多了，好烦啊。
情感分类结果：中性

枯藤老树昏鸦，小桥流水人家，古道西风瘦马。夕阳西下，断肠人在天涯。
情感分类结果：正向

其他的都比较准确，准确率为80%左右。10个调用，用时7秒，每次调用0.7秒左右，速度较快。

应用前景：
文本纠错有很广阔的应用前景，包括：
评论分析与决策，通过对产品多维度评论观点进行倾向性分析，给用户提供该产品全方位的评价，方便用户进行决策
评论分类，通过对评论进行情感倾向性分析，将不同用户对同一事件或对象的评论内容按情感极性予以分类展示
舆情监控，通过对需要舆情监控的实时文字数据流进行情感倾向性分析，把握用户对热点信息的情感倾向性变化

产品建议：

建议针对口语化场景，古诗等内容进行优化。

热门活动

个赞

共21条回复最后由用户已被禁言回复于2022-04

#22才能我浪费99回复于2019-05

对#20 风搅火回复

不光是学生，上班族更需要

大家都需要啊

#21才能我浪费99回复于2019-05

对#19 风搅火回复

以后心理医生的职业需求量应该很大

现代人压力大啊

#20风搅火回复于2019-05

对#16 才能我浪费99回复

学生都比较年轻，这方面需求很多

不光是学生，上班族更需要

#19风搅火回复于2019-05

对#17 wangwei8638回复

现在是个趋势

以后心理医生的职业需求量应该很大

#18才能我浪费99回复于2019-05

对#17 wangwei8638回复

现在是个趋势

是啊，心理健康很重要

#17wangwei8638回复于2019-05

对#15 小雨青青润无声回复

心理健康很重要，现在各学校都配有心理医生

现在是个趋势

#16才能我浪费99回复于2019-05

对#15 小雨青青润无声回复

心理健康很重要，现在各学校都配有心理医生

学生都比较年轻，这方面需求很多

#15小雨青青润无声回复于2019-05

对#14 才能我浪费99回复

这个建议很有意思

心理健康很重要，现在各学校都配有心理医生

#14才能我浪费99回复于2019-05

对#13 小雨青青润无声回复

应该给每个家长都配一个分析孩子的心里

这个建议很有意思

#13小雨青青润无声回复于2019-05

对#12 才能我浪费99回复

这个AI的效果的确不错

应该给每个家长都配一个分析孩子的心里

#12才能我浪费99回复于2019-04

对#10 风搅火回复

确实，AI分享的比人分析的更准确

这个AI的效果的确不错

#11风搅火回复于2019-04

对#4 才能我浪费99回复

感觉可以应用到客服的场景

在人与人接触的工作应用会更广泛些

#10风搅火回复于2019-04

对#2 才能我浪费99回复

使用了一下，感觉功能很不错

确实，AI分享的比人分析的更准确

#9才能我浪费99回复于2019-04

对#5 wangwei8638回复

支持

谢谢，你写的也都很不错啊

#8蓝色的风339回复于2019-04

感谢分享，赞一个

#7蓝色的风339回复于2019-04

对#4 才能我浪费99回复

感觉可以应用到客服的场景

还可以紧张面对面的销售分析

#6蓝色的风339回复于2019-04

通过这可以进行面试分析

#5wangwei8638回复于2019-04

支持

#4才能我浪费99回复于2019-04

感觉可以应用到客服的场景

#3才能我浪费99回复于2019-04

大家可以用这个攻略感受一下

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服