PCA算法主要用于降维,就是将样本数据从高维空间投影到低维空间中,并尽可能的在低维空间中表示原始数据。PCA的几何意义可简单解释为: 0维-PCA:将所有样本信息都投影到一个点,因此无法反应样本之间的差异;要想用一个点来尽可能的表示所有样本数据,则这个点必定是样本的均值。 1维-PCA:相当于将所有 ...
分类:
其他好文 时间:
2020-09-17 16:36:11
阅读次数:
28
聚合操作主要用于处理数据并返回计算结果。聚合操作将来自多个文档的值组合在一起,按条件分组后,再进行一系列操作(如求和、平均值、最大值、最小值)以返回单个结果。 MongoDB 提供了三种执行聚合的方法:聚合管道、map-reduce 和单一目标聚合方法,这里只介绍前两种方法。 聚合管道方法 Mong ...
分类:
数据库 时间:
2020-09-17 12:01:48
阅读次数:
32
公式原理 对于随机变量$X$,\(Y\),协方差$COV(X,Y)=E(X-\bar)(Y-\bar)=E(XY)-EXEY$ 假设选取n个样本即,对于总体$X$的样本即为$X_1=[x_1,x_2,x_3,...]\(,均值记为\)\bar=\frac{1}\sum_i$,$Y$同上 样本方差计算 ...
分类:
其他好文 时间:
2020-09-08 20:42:48
阅读次数:
82
一、模型评估与选择 2.2.1留出法 1、直接将数据集划分为两个互斥的集合,即D=sUt,s∩t=空集 2、在s上训练出模型,用t来评估其测试误差 3、s/t的划分尽可能保持数据分布的一致性,至少要保持样本的类别比例相似 4、若s,t中的样本比例差别很大,则误差估计将由训练/测试数据分布的差异而产生 ...
分类:
其他好文 时间:
2020-08-28 11:48:55
阅读次数:
52
1.什么是聚合聚合是MongoDB的高级查询语言,它允许我们通过转化合并由多个文档的数据来生成新的在单个文档里不存在的文档信息。MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果,有点类似sql语句中的count(*)。在MongoDB中,有两种方式计算聚合:Pipeline和MapReduce。Pipeline查询速度快于MapReduc
分类:
数据库 时间:
2020-08-19 20:09:42
阅读次数:
128
题目: 给定一个非空二叉树, 返回一个由每层节点平均值组成的数组。 示例: 输入: 3 / \ 9 20 / \ 15 7 输出:[3, 14.5, 11] 解释: 第 0 层的平均值是 3 , 第1层是 14.5 , 第2层是 11 。因此返回 [3, 14.5, 11] 。 提示: 节点值的范围 ...
分类:
其他好文 时间:
2020-08-18 13:35:07
阅读次数:
57
<span style=“font-size:18px;”> MYSQL常用命令 1.导出整个数据库 mysqldump -u 用户名 -p –default-character-set=latin1 数据库名 > 导出的文件名(数据库默认编码是latin1) mysqldump -u wcnc - ...
分类:
数据库 时间:
2020-08-17 17:27:17
阅读次数:
80
一、聚合函数:(都会忽略null数据) 1、常用的有5种:将字段中所有的数据聚合在一条中 1、sum(字段名) :求总和 2、avg(字段名) :求平均值 3、max(字段名) :求最大值 4、min(字段名) :求最小值 5、count(字段名、*) :统计行数 2、按部门编号,查询平均薪水 ,并 ...
分类:
数据库 时间:
2020-08-10 11:02:21
阅读次数:
102
import tensorflow as tf import numpy as np import matplotlib.pylab as plt plt.rcParams["font.family"] = 'SimHei' # 将字体改为中文 plt.rcParams['axes.unicode_ ...
分类:
其他好文 时间:
2020-08-09 13:05:56
阅读次数:
65
ARPU及其计算方式 ARPU Average Revenue Per User 用户平均收益 计算公式: ARPU = 总收入 / 用户数 ARPU具有时间价值,但我们认为它在某一段时间内稳定,一般直接使用一段时间内的均值,可以是7日的ARPU也可以是10日的,默认为月ARPU 基本公式的变形: ...
分类:
其他好文 时间:
2020-08-08 10:35:28
阅读次数:
183