贝叶斯滤波三大概率 先验概率 似然概率 后验概率 离散情况下的贝叶斯滤波 全概率公式:$P(T_m=10.3)=P(T_m=10.3|T=10)P(T=10)+P(T_m=10.3|T=11)P(T=11)$ 其中$P(T_m=10.3|T=10)$是似然概率(代表传感器精度),$P(T=10)$是 ...
分类:
编程语言 时间:
2020-05-24 12:03:59
阅读次数:
123
[TOC] 我有一点点机器学习的基础,这一章阅读起来还是比较轻松。 1 统计学习 1.1 背景 这里首先要介绍一下 贝叶斯派 和 频率派 。举个栗子:一个病毒检测试剂,如果受检者为阳性,误检率为1%,如果受检者为阴性,误检率为2%;若人群中某个人的检测结果为阳性,则此人携带病毒的概率是多少。概率派观 ...
分类:
其他好文 时间:
2020-05-23 10:03:51
阅读次数:
86
概率Probability,先验概率Prior,后验概率Posterior 概率是一个衡量不确定性的工具。 一个例子:我们来估测某一个人的生日是十月份的概率, 在没有任何数据样本的情况下 ,我们可以估计这个概率是$Pr(October) = \frac{1}{12}\approx8.3%$. 现在假 ...
分类:
其他好文 时间:
2020-05-22 00:15:35
阅读次数:
51
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-21 10:23:57
阅读次数:
57
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-20 20:26:30
阅读次数:
63
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r"SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') data = csv.reader(sms, deli ...
分类:
其他好文 时间:
2020-05-20 12:11:10
阅读次数:
47
一、概率基础 概率定义:概率定义为一件事情发生的可能性,例如,随机抛硬币,正面朝上的概率。 联合概率:包含多个条件,且所有条件同时成立的概率,记作:𝑃(𝐴,𝐵) 。 条件概率:事件A在另外一个事件B已经发生条件下的发生概率,记作:𝑃(𝐴|𝐵) 。P(A1,A2|B) = P(A1|B)P ...
分类:
编程语言 时间:
2020-05-20 12:00:22
阅读次数:
73
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r"SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') data = csv.reader(sms, deli ...
分类:
其他好文 时间:
2020-05-19 23:11:49
阅读次数:
147
完备事件组 设 Ω 为试验E的样本空间,B1, B2, …, Bn 为E的一组事件。若 Bi ∩ Bj = Φ (i ≠ j 且 i, j =1, 2, …n) B1 U B2 U … U Bn = Ω 则称B1, B2, …, Bn 为样本空间 Ω 的完备事件组的一个划分。 注:上图就是对一个样本 ...
分类:
其他好文 时间:
2020-05-18 21:02:50
阅读次数:
85
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv sms=open("D:\机器学习\SMSSpamCollection",'r',encoding='utf-8') csv_reader=csv.reader(sms, delimiter='\t') for ...
分类:
其他好文 时间:
2020-05-18 20:22:09
阅读次数:
49