导读 数据成本是困扰业务增长的老大难问题,分解来看可分为获取成本、应用成本、运营成本、安全成本等等,而安全成本可谓是让企业深恶痛绝。一份报告显示,数据泄露损失最高可以占到企业年收入的5%。更令人关注的是,数据泄露不止是短期损失。 数据成本是困扰业务增长的老大难问题,分解来看可分为获取成本、应用成本、 ...
分类:
其他好文 时间:
2019-11-23 22:13:17
阅读次数:
106
原文链接:http://tecdat.cn/?p=8890 主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合?来自预测变量的主成分(PC)。这带来许多优点: 预测变量的数量实际上没有限制。 相关的预测变量不会破坏回归拟合。 但是,在许多情况下,执行类似于PCA的分解要明 ...
分类:
编程语言 时间:
2019-11-22 19:09:48
阅读次数:
154
In [1]: import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt In [2]: #创建一个矩阵 a = np.array([[1, 2], [3, 4]]) ...
分类:
编程语言 时间:
2019-11-22 09:12:22
阅读次数:
117
一、正则化与偏差-方差分解 Regularization:减少方差的策略 误差可分解为:偏差,方差与噪声之和,即误差 = 偏差 + 方差 + 噪声之和 偏差:度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力 方差:度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画 ...
分类:
其他好文 时间:
2019-11-21 23:19:49
阅读次数:
224
重构是 一种对软件进行修改的行为,但它并不改变软件的功能特征,而是通过让软件程序更清晰,更简洁和更条理来改进软件的质量。代码重构之于软件,相当于结构修改之于散文。每次人们对如何对代码进行重构的讨论就像是讨论如果对一篇文学作品进行修订一样无休无止。所有人都知道应该根据项目的自身情况来对代码进行重构,而 ...
分类:
其他好文 时间:
2019-11-21 22:40:32
阅读次数:
119
递归的起始端拥有更多的计算上下文; 递归的末端具有更多的可计算性; 递的过程是: 1、计算上下文的分解与最终可计算性的逼近; 2、将可计算性表述为待定值; 归的过程是: 1、执行直接可计算表达式; 2、赋值待定值,并执行计算; 3、返回上一层继续; f(n) = f(n-1) + f(n-2)表述; ...
分类:
其他好文 时间:
2019-11-21 18:32:57
阅读次数:
86
"[CSP2019] 划分" 题意 有 $n$ 个非负整数 $a_i$ $( n \le 4 10^7)$, 将它们分为若干部分, 记为 $S_i$, 要求 $S_{i+1} \ge S_i$, 设 $res=\sum_{i=1}^{k} S_i^2$. 求 $res$ 的最小值 思路 64 pts ...
分类:
其他好文 时间:
2019-11-20 12:19:55
阅读次数:
228
在项目开发的过程中,我们往往遇到文本溢出需要添加省略号的需求。而这个需求可以分解为两个,一个是单行溢出省略,一个是多行溢出省略。 单行溢出省略 效果 多行文字溢出省略 效果 ...
分类:
Web程序 时间:
2019-11-19 15:49:14
阅读次数:
74
欧拉定理(EX及证明) [TOC] 本篇很多推论基于质数唯一分解定理,请读者先行了解。 欧拉函数 定义 有两种: 1. 定义欧拉函数 $\varphi(x)$ 表示小于 $x$ 且与 $x$ 互质的数的个数,定义 $1$ 与任何数互质。 2. 定义 剩余类 $c_i$ 是 $mod\;x=i$ 的数 ...
分类:
其他好文 时间:
2019-11-19 15:47:50
阅读次数:
91
TBase 是腾讯数据平台团队在开源的 PostgreSQL 基础上研发的企业级分布式 HTAP 数据库管理系统: 具备高性能可扩展的分布式事务能力,支持 RC 和 RR 两种隔离级别; 通过安全、管理、审计三权分立体系,提供全方位的数据安全保证机制; 支持高性能分区表,可使得数据检索效率成倍提升; ...
分类:
数据库 时间:
2019-11-19 00:43:06
阅读次数:
120