1、Spark MLlib LDA源代码解析 http://blog.csdn.net/sunbow0 Spark MLlib LDA 应该算是比較难理解的,当中涉及到大量的概率与统计的相关知识,并且还涉及到了Spark GraphX图计算方面的知识。要想明确当中的原理得要下一番功夫。LDA源代码解 ...
分类:
其他好文 时间:
2017-06-28 21:41:38
阅读次数:
267
简介 SymPy是一个符号计算的Python库。它的目标是成为一个全功能的计算机代数系统,同时保持代码简 洁、易于理解和扩展。它完全由Python写成,不依赖于外部库。SymPy支持符号计算、高精度计算、模式匹配、绘图、解方程、微积分、组合数学、离散 数学、几何学、概率与统计、物理学等方面的功能。( ...
分类:
其他好文 时间:
2016-08-30 22:32:41
阅读次数:
7378
1,基本概念 (1)期望 \( E(X)=\sum_i{x_ip_i} \) important E(kX) = kE(X) E(X+Y) = E(X)+E(Y) 当X和Y相互独立:E(XY)=E(X)E(Y) (这个不能反向推哦) (2)方差 \( D(X)=\sum_i{(x_i-E(X))^2 ...
分类:
其他好文 时间:
2016-07-10 16:49:41
阅读次数:
215
主要讲解了贝叶斯概率与统计派概率的不同。
概率论,决策论,信息论(probability theory, decision theory, and information theory)是以后用到的三个重要工具,本节主要介绍概率论,这里的介绍还是结合前面的多项式拟合的例子讲解。...
分类:
其他好文 时间:
2016-05-06 15:58:06
阅读次数:
285
内容简介:
A.重要统计量
B.重要定理与不等式
C.参数估计
A.重要统计量
一、概率与统计
概率:已知总体的分布情况,计算事件的概率
统计:总体分布未知,通过样本值估计总体的分布
二、概率统计与机器学习的关系
1.统计估计的是分布,机器学习训练出来的是模型,模型可能包含了多个分布。
2.训练与预测过程的一个核心评价指标是模型的误差。
3.误差可以是概率的形式,...
分类:
其他好文 时间:
2016-05-06 15:17:11
阅读次数:
201
目录:略前言:本书的写作目的是介绍“概率机器人学”这个崭新的研究领域。概率机器人学是与智能和控制相关的机器人学的一个分支领域。其特征是利用概率与统计的方式进行记录信息与行动决策。针对在使用机器人学技术中不可回避的“不确定性”问题,我们认为机器人学必须以此方法为目标。采用概率论方法的算法设计在近年来已...
分类:
其他好文 时间:
2016-01-20 01:09:12
阅读次数:
503
本文讲解了泊松分布和指数分布的公式以及应用场景,并且讲解了一种构造随机数生成器的简便方法以及两种分布的随机数生成器的C语言程序...
分类:
编程语言 时间:
2015-05-05 23:59:51
阅读次数:
533
1. 矩的概念图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。矩是概率与统计中的一个概念,是随机变量的一种数字特...
分类:
其他好文 时间:
2014-09-28 21:41:15
阅读次数:
490
1 随机变量的概念顾名思义,随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离。但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理。根...
分类:
其他好文 时间:
2014-08-12 18:33:54
阅读次数:
418
一、概率是什么概率是表示某种情况(事件)出现的可能性大小的一种数量指标,它介于0与1之间。1.1 主观概率凭着经验和知识对事件发生的可能性作出的一种主观估计,主观概率可以理解为一种心态或倾向性。1.2 等可能试验假定某个试验有有限个可能的结果$e_1,e_2,\dots,e_N$。假定从该试验的条件...
分类:
其他好文 时间:
2014-08-07 21:38:11
阅读次数:
380