为什么朴素贝叶斯如此朴素?主要由于它假定所有的特征在所有的数据集上是同等重要和独立的。这个假设在现实世界中是不真实的,所以说朴素。朴素贝叶斯(naive bayes),简单的假设特征条件独立,现实中独立的东西是不存在的,但是相关性较小的事物比较多的,于是贝叶斯往往能取得很好的效果。下面看下朴素贝叶斯 ...
分类:
其他好文 时间:
2019-05-22 00:11:40
阅读次数:
133
本文简单介绍了线性回归、lasso回归和岭回归,主要说明为什么 lasso 更容易使部分权重变为 0 而 ridge 不行,或者说为什么 lasso 可以进行 feature selection,而 ridge 不行。 ...
分类:
其他好文 时间:
2019-05-11 21:12:13
阅读次数:
111
正太分布:也叫(高斯分布Gaussian distribution),是一种随机概率分布 机器学习中numpy.random如何生成这样的正态分布数据,本篇博客记录这样的用法 import numpy as np# a = np.random.randint(1,10,size=2) # 最小值,最 ...
分类:
编程语言 时间:
2019-05-07 19:41:46
阅读次数:
335
1,概述 关于任务型对话的简介看任务型对话(一)—— NLU(意识识别和槽值填充)。 首先我们来看下对话状态和DST的定义。 对话状态:在$t$时刻,结合当前的对话历史和当前的用户输入来给出当前每个slot的取值的概率分布情况,作为DPL的输入,此时的对话状态表示为$S_t$。 DST(对话状态追踪 ...
分类:
其他好文 时间:
2019-04-30 20:11:29
阅读次数:
898
CRF与NER简介 CRF,英文全称为conditional random field, 中文名为条件随机场,是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫(Markov)随机场。 较为简单的条件 ...
分类:
其他好文 时间:
2019-04-30 14:04:22
阅读次数:
125
1. 引言 在介绍论文之前,我将先简单介绍一些相关背景知识。首先是语言模型(Language Model),语言模型简单来说就是一串词序列的概率分布。具体来说,语言模型的作用是为一个长度为m的文本确定一个概率分布P,表示这段文本存在的可能性。在实践中,如果文本的长度较长,P(wi | w1, w2, ...
分类:
编程语言 时间:
2019-04-19 12:02:30
阅读次数:
198
softmax是什么? 函数 Softmax(x) 也是一个 non-linearity, 但它的特殊之处在于它通常是网络中一次操作. 这是因为它接受了一个实数向量并返回一个概率分布.其定义如下. 定义 x 是一个实数的向量(正数或负数都无所谓, 没有限制). 然后, 第i个 Softmax(x) ...
分类:
其他好文 时间:
2019-04-08 15:42:07
阅读次数:
375
##marg 基础 摘自贺一家的博客 在我们这个工科领域,它来源于概率论中的边际分布(marginal distribution)。如从联合分布p(x,y)去掉y得到p(x),也就是说从一系列随机变量的分布中获得这些变量子集的概率分布。回忆了这个概率论中的概念以后,让我们转到SLAM的Bundle ...
分类:
其他好文 时间:
2019-03-14 19:57:25
阅读次数:
965
结构信息论—结构信息度量 李昂生教授 网络空间大数据信息处理的高效算法要求满足高精度和快速两个主要指标。快速容易理解,高精度一直是一个难题,原因在于我们常常不知道要优化的目标是什么。现实世界的大数据空间是客观世界生成的对象(对象是有结构的,往往可以看成一个图),是有规律的,也有噪音和随机性,我们知道 ...
分类:
其他好文 时间:
2019-03-12 21:18:20
阅读次数:
256
统计学中最常见的几种概率分布分别是正态分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribution,chi-square distribution),其中后三种属于抽样分布。 为什么要研究概率 ...
分类:
其他好文 时间:
2019-02-15 15:50:54
阅读次数:
630