NDCG(归一化折损累计增益)
创始人
2024-06-02 00:55:37

乍一看这个名字有点唬人,其实就是只纸老虎,看完本文肯定有所收获。

NDCG可作为推荐系统中top-k推荐的评测指标,顾名思义top-k推荐就是一次给用户推荐k个物品(长度为k的列表[1,2,3, ……,k]),那怎么去评价这个推荐列表的好坏呢?让我们按G-CG-DCG-IDCG-NDCG的顺序一步一步来看。

1. Gain:表示物品的相关性分数,符号为rel_{i},推荐系统中表示推荐给用户的列表中的第i个物品,用户是否喜欢(喜欢为1,不喜欢为0)。

2. Cumulative Gain(CG):对列表中的所有物品i的收益进行累加,符号表示为CG = \sum_{i=1}^{k}rel_{i}。这个很好理解,就是推荐给用户的列表中用户喜欢的物品的总数量,这只有数量上的意义,但其实序列中各物品排列的顺序顺序的不同,对用户的偏好也是存在影响的,所以就有了接下来的指标。

3.Discounted  Cumulative Gain(DCG):DCG考虑了位置因素,为每一个rel_{i}都添加了一个折损值,公式如下所示。注意DCG只是简单的累加,只能用于同等长度的序列之间的比较,毕竟列表越长不一定越好是不是。

        DCG = \sum_{i=1}^{k}\frac{rel_{i}}{log_{2}(i+1))}

可见物品在列表中位置越靠前,折损值越小;越靠后,折损值越大。

4. IDCG:DCG的一种特例,物品i在列表中按rel_{i}从大到小排列即DCG最大的情况。

5. NDCG(归一化折损累计增益):用IDCG对DCG做归一化,可用于不同长度序列之间的比较。同等长度序列之间比较,也可以实现去量纲。

       NDCG = \frac{DCG}{IDCG}

相关内容

热门资讯

苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
阿西吧是什么意思 阿西吧相当于... 即使你没有受到过任何外语培训,你也懂四国语言。汉语:你好英语:Shit韩语:阿西吧(아,씨발! )日...