1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于 ...
分类:
其他好文 时间:
2021-03-02 12:10:47
阅读次数:
0
导言 TcaplusDB是腾讯出品的分布式NoSQL数据库,存储和调度的代码完全自研。具备缓存+落地融合架构、PB级存储、毫秒级时延、无损水平扩展和复杂数据结构等特性。同时具备丰富的生态、便捷的迁移、极低的运维成本和五个九高可用等特点。TcaplusDB产品团队目前运营着全球最大的游戏数据库集群,服 ...
分类:
数据库 时间:
2021-02-27 13:10:57
阅读次数:
0
来源一:过期引用 public class Stack { // 底层使用的是数组 没毛病 private Object[] elements; // size作为指针 没毛病 private int size = 0; // 默认容量 没毛病 private static final int DE ...
分类:
其他好文 时间:
2021-02-22 12:42:58
阅读次数:
0
本文主要是对信息熵、信息增益、信息增益比和 Gini 指数的定义进行汇总,使之更加明确记忆。 信息熵和条件熵 信息熵 熵(entropy)是表示随机变量不确定的度量。设 \(X\) 是一个取有限个值的离散随机变量,其概率分布为 \(P(X=x_i) = p_i, \quad i=1, 2, ..., ...
分类:
其他好文 时间:
2021-02-19 13:40:50
阅读次数:
0
波动率模型主要用于研究金融时间序列分析,本章主要介绍了ARCH模型和GARCH模型的基本性质和推导。 ...
分类:
其他好文 时间:
2021-02-18 13:53:15
阅读次数:
0
概率论研究那些受到随机事件(random events)影响的现象,它们具有很大的不确定性。 基础定义 讨论概率时,最重要的就是不确定性的思想,我们需要引入一个足够宽泛的、用于处理不确定性的概念。偶然性试验(chance experiment)或随机试验(random experiment)是产生不 ...
分类:
其他好文 时间:
2021-02-17 15:12:51
阅读次数:
0
新年快乐! by もや造 题意 原题面 有$n$个点,对于每个点$i(i≤n)$都有一条连向$i+1$的边,形成一条链,并在其中加入$m$条返祖边 现在从1号节点出发,每次等概率的前往到一个相邻的节点,求走到第$n+1$个点的期望步数 \(n,m≤10^6\) 分析 设$E_{x→y}$表示从$x$ ...
分类:
其他好文 时间:
2021-02-16 11:41:44
阅读次数:
0
LDA是什么 隐含狄利克雷分布(Latent Dirichlet Allocation,以下简称LDA),是由Blei, David M.、Ng, Andrew Y.、Jordan于2003年提出的一种主题模型,是一种无监督机器学习技术,它可以将文档集中每篇文档的主题以概率分布的形式给出,从而通过分 ...
分类:
其他好文 时间:
2021-02-10 13:21:54
阅读次数:
0
这个世界上有很多的都很简单,只是你不了解它,不懂得方法,没有认真得执行! 信息不对称是永恒得主题,在合适得时间做合适得事情,就会事半功倍,就可以成功! 那自媒体到底该怎么赚钱呢?自媒体得盈利方向有哪些呢? 在开始做自媒体运营之前呢,我们必须要懂得自媒体有哪些盈利模式,然后找出我们要做得模式,针对性得 ...
分类:
其他好文 时间:
2021-02-10 12:57:25
阅读次数:
0
众所周知,架构特点多以"ility"结尾(例如 scalability、deployability),也被称为 NFR(非功能需求)、质量属性。架构的特点没有固定清单,但标准是有的,就是 ISO25010: 我们从业务需求(业务特征)、我们期望的系统运营方式(运营特征)中总结出这些特点,它们是隐式的 ...
分类:
其他好文 时间:
2021-02-03 10:57:53
阅读次数:
0