1. Perplexity (PPL) 假设长度为 n 的句子 $s=(w_1,w_2,...,w_n)$,它的 perplexity 定义为: ...
分类:
其他好文 时间:
2021-05-24 06:03:58
阅读次数:
0
上一篇文章主要聊了下《转化率模型之转化数据延迟》,今天我们将开启一个新的系列,广告流量分析之评价指标的选择。在平时做AB实验的时候,我们常常遇到一种奇怪的现象“线上效果与线下的分析结论不一致”,为什么会存在这种现象呢,这里通过几个实际案例和大家具体聊聊。 案例一:转化率评价(需要明确自己的关注目标) ...
分类:
其他好文 时间:
2021-05-24 04:25:50
阅读次数:
0
一、AUC含义 AUC是二分类指标ROC曲线下方的面积,在0~1之间。而在预测结果概率列表中可以理解为负样本排在正样本前面的概率(对概率值列排序)。 二、概率列表 通常建模结果可以输出为包含两列的表,第一列为真实标签(1/0),第二列为预测标签1的概率,示例如下: 三、利用awk计算AUC (1)先 ...
分类:
系统相关 时间:
2021-04-10 12:59:15
阅读次数:
0
一、可用性测试 定义:设计过程中被用来改善易用性的一系列方法,为用户提供一系列可操作场景和任务,与产品或者服务密切相关 1、表现形式 ①.产品的基本自然属性,用户体验的一种衡量程度 ②.依照原型图对GUI的评估 ③.体现在产品和用户的交互友好性 ④.评价指标:效率、满意、安全(容错、无错) 2、测试 ...
分类:
其他好文 时间:
2021-01-07 12:19:47
阅读次数:
0
PSNR,峰值信噪比,通常用来评价一幅图像压缩后和原图像相比质量的好坏,当然,压缩后图像一定会比原图像质量差的,所以就用这样一个评价指标来规定标准了。PSNR越高,压缩后失真越小。这里主要定义了两个值,一个是均方差MSE,另一个是峰值信噪比PSNR,公式如下: 这里的MAX通常是图像的灰度级,一般就 ...
分类:
其他好文 时间:
2020-09-17 20:44:46
阅读次数:
29
两个排序列表的相似性 在信息检索领域,我们常用MAP、MRR、NDCG来评估排序算法的好坏,然而这些指标依赖人工标注的query与document的相关性档位(relevance level)。当没有此标注数据,或者我们要评估的排序列表跟相关性无关,并且我们刚好有一个待比较的基准列表时,该如何评估它... ...
分类:
其他好文 时间:
2020-09-15 21:08:54
阅读次数:
37
文章来自:微信公众号【机器学习炼丹术】 1 什么是非均衡 分类(classification)问题是数据挖掘领域中非常重要的一类问题,目前有琳琅满目的方法来完成分类。然而在真实的应用环境中,分类器(classifier)扮演的角色通常是识别数据中的“少数派”,比如: 银行识别信用卡异常交易记录 垃圾 ...
分类:
其他好文 时间:
2020-08-03 00:52:13
阅读次数:
123
发表在 NAACL 2019 MOTIVATION 在这之前,对于文本风格迁移后的效果没有一个很好的统一评价指标,因此,这篇文章做了一个总结,基于之前的一些工作提出从 style transfer intensity 、content preservation、 naturalness 这三个方面来 ...
分类:
其他好文 时间:
2020-07-23 23:10:57
阅读次数:
77
一、 排序的稳定性:A、B关键字相同,排序后A、B先后次序保持不变——这种排序算法是稳定的 排序算法效率的评价指标: 1.时间效率——排序速度:比较次数和移动次数 2.空间效率——占内存辅助空间大小 3.稳定性 二、 第二步:后移至从最后一个数开始移动(避免覆盖数据 三、 1.找 2.移动 3.写入 ...
分类:
其他好文 时间:
2020-07-12 22:45:56
阅读次数:
73
一.知识梳理 若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序 逐步扩大记录的有序序列长度的过程 外部排序 插入 交换 选择归并 分配 排序算法效率的评价指标:时间效率 空间效率 稳定性 ( A和B的关键字相等,排序后A、B的先后次序保持不变) ?直接插入排序(基于顺序查找) 从R[ ...
分类:
其他好文 时间:
2020-07-12 19:04:26
阅读次数:
67