BN解决方差漂移理论 训练集的数据分布和预测集的数据分布不一致,这样的情况下如果我们在训练集上训练出一个分类器,肯定在预测集上不会取得比较好的效果。这种训练集和预测集样本分布不一致的问题就叫做“covariate shift”现象 训练集和测试集的数据分布不一致,因此训练出来的模型是没有泛化能力的 ...
分类:
其他好文 时间:
2020-07-10 19:12:42
阅读次数:
45
相关类 灰色关联 1作用:系统分析主要因素;次要因素,因素对系统发展的影响,以便对各因素强化发展或者抑制发展。 2 灰色关联分析的基本思想:根据序列曲线的几何形状的相似程度判断其联系紧密性 3 具体操作步骤: (1)绘图:各指标,各系统的发展趋势 (2)确定分析数列: 母序列:能反映系统行为特征的数 ...
分类:
其他好文 时间:
2020-07-10 13:17:04
阅读次数:
106
逐点互信息(PIM):用来衡量两个事物的相关性 定义如下: 在概率论中,我们知道,如果x跟y不相关,则 P(x,y) = P(x)P(y)。二者相关性越大,则 P(x,y) 就相比于 P(x)P(y) 越大。根据条件概率公式,你还可以写成 这也很好理解,在y出现的情况下x出现的条件概率 p(x|y) ...
分类:
其他好文 时间:
2020-07-10 09:46:42
阅读次数:
91
当线程执行通过后,接来下来我们看一下如何监测服务器相关性能指标: 一、需要安装ServerAgent插件到服务器和本地,进行连接: (1)网上下载ServerAgent,并解压到本地后,把lib/ext目录下的JMeterPlugins-Standard.jar复制到Jmeter相同目录下(lib/ ...
分类:
其他好文 时间:
2020-07-07 19:34:37
阅读次数:
61
pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速 ...
分类:
其他好文 时间:
2020-07-02 16:38:40
阅读次数:
126
小区搜索过程:UE开机后,开始扫描系统中心频带内的同步信号PSS和SSS,进行小区搜索。具体过程如下图所示:第一步:PSS检测。利用ZC的相关性检测主同步信号(PSS),取得最大相关值的位置即为OFDM符号的起始位置,同时可以确定最大相关值对应的PSS中的u值,即可确定扇区ID 。PSS的检测只能实 ...
分类:
其他好文 时间:
2020-06-25 21:39:31
阅读次数:
73
今天参考苏神 https://kexue.fm/archives/7476 和 https://kexue.fm/archives/7430 这两篇博文,学习一下用BERT研究token之间相关性的方法,然后用SciBERT在论文文本里实践一下。 ...
分类:
其他好文 时间:
2020-06-25 11:48:26
阅读次数:
108
A Survey on Causal Inference 因果推理,其覆盖众多的研究领域,如何从观测数据中估计因果效应是主要的研究内容。常说‘关系不代表因果’. 比如,一项研究表面,吃早餐的女孩比不吃早餐的女孩更瘦,因此得出结论:‘吃早餐能减肥‘。 但事实上,吃早餐和瘦这2件事也许只是存在相关性,瘦 ...
分类:
其他好文 时间:
2020-06-24 20:09:45
阅读次数:
127
1.1. 数据科学基础 1.1.1. 概率基础 1. 概率的定义概率的完备定义;古典概率;基于频率的概率估计;基于专家推测的概率估计 随机变量及其特征度量随机变量定义;随机变量数学期望;随机变量方差与标准差;期望-方差决策理论;相关性;独立性; 常用离散随机变量分布贝努利分布;二项分布;泊松分布 常 ...
分类:
其他好文 时间:
2020-06-23 00:44:39
阅读次数:
136
题目传送门 ####【题目描述】 为了获知基因序列在功能和结构上的相似性,经常需要将几条不同序列的DNA进行比对,以判断该比对的DNA是否具有相关性。 现比对两条长度相同的DNA序列。定义两条DNA序列相同位置的碱基为一个碱基对,如果一个碱基对中的两个碱基相同的话,则称为相同碱基对。接着计算相同碱基 ...
分类:
其他好文 时间:
2020-06-19 23:18:27
阅读次数:
46