PaddleTextGEN项目seq2seq下的

首页版块访问AI主站注册发帖

新版小萱萱发布于2020-01 浏览:2197 回复:1

PaddleTextGEN项目seq2seq下的

快速回复

models/PaddleNLP/PaddleTextGEN/seq2seq/该项目是官方的翻译模型项目，我想问的是该模型中，计算的ppl值，在训练集，验证集和测试集都有计算的这个值，这是perplexity的计算吗？但跟网上查到的perplexity公式不一样。该代码中是这样计算的ppl = np.exp(total_loss / word_count)，所以这里的ppl是什么度量的计算呢？请求解惑，感谢。具体相关代码如下：

def eval(data, epoch_id=0):
        eval_data_iter = reader.get_data_iter(data, batch_size, mode='eval')
        total_loss = 0.0
        word_count = 0.0
        for batch_id, batch in enumerate(eval_data_iter):
            input_data_feed, word_num = prepare_input(
                batch, epoch_id, with_lr=False)
            fetch_outs = exe.run(inference_program,
                                 feed=input_data_feed,
                                 fetch_list=[loss.name],
                                 use_program_cache=False)

            cost_train = np.array(fetch_outs[0])

            total_loss += cost_train * batch_size
            word_count += word_num

        ppl = np.exp(total_loss / word_count)

	return ppl

技术问答

个赞

共1条回复最后由饭小团回复于2020-07

#2饭小团回复于2020-07

这是自然语言处理的问题吗？

快速回复

小编推荐

【强化学习算法】原理介绍

猪腰子3 12回复

【强化学习算法】PARL介绍、常见问题和解决方法

猪腰子3 12回复

【强化学习算法】常见应用

猪腰子3 7回复

NLP常见问题汇总

用户已被禁言 8回复

第三期【百度大脑新品体验】手写诗一首，AI来读

wangwei8638 66回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服