自然语言处理入门基础 1 数学基础 (1)线性代数 向量、 矩阵、距离计算(余弦距离、欧式距离、曼哈顿距离、明可夫斯基距离、切比雪夫距离、杰卡德距离、汉明距离、标准欧式距离、皮尔逊相关系数) (2)概率论 随机试验、条件概率、全概率、贝叶斯定理、信息论 (3)统计学 图形可视化(饼图、条形图、热力图 ...
分类:
其他好文 时间:
2020-01-19 12:39:31
阅读次数:
72
1.1 统计学习 统计学习是关于计算机基于数据构建概率模型并用模型对数据进行分析与预测的一门学科。统计学习也成为统计机器学习。 (1)统计学的主要特点: 1、统计学习以计算机及网络为平台,是建立在计算机及网络之上的 2、统计学习以数据为研究对象,是数据驱动的科学。 3、统计学习的目的是对数据进行预测 ...
分类:
其他好文 时间:
2020-01-11 13:18:41
阅读次数:
142
[TOC] 统计学习 对象:data 目的:预测和分析 方法 监督,无监督,强化学习 基本分类 1. 监督学习 从标注数据中学习预测模型 建设$(X,Y)$遵循联合概率分布$P(X,Y)$, 样本独立同分布 假设空间:输入空间到输出空间映射的集合 2. 无监督 $X$是输入空间,$Z$是隐式结构空间 ...
分类:
其他好文 时间:
2020-01-05 10:13:03
阅读次数:
95
控制图与其他统计工具(如直方图,相关图和帕累托图)一起用于统计过程控制(SPC)中,以分析和统计控制许多领域(运营,服务等)中的业务流程。特别是,控制图可支持用户分析流程内部的可变性来源。 通过控制图,可以区分:-由于无法控制的常见原因导致的正常可变性;-系统可变性,取决于不规则的机器,有缺陷的原材 ...
分类:
其他好文 时间:
2019-12-31 12:17:37
阅读次数:
73
同在自学cs229。我是看完ng在coursera上的机器学习视频来的。一楼的老兄说的没错,听课之前最好还是先浏览一下材料,然后不懂的地方去结合李航的《统计学习方法》上面找答案。实战的话,《机器学习实战》对初学者很友好。Ng讲完哪个算法,去《统计》上巩固一下,然后找到《实战》上对应的章节用pytho ...
分类:
其他好文 时间:
2019-12-24 15:39:04
阅读次数:
72
统计学习方法与Python实现(三)——朴素贝叶斯法 iwehdio的博客园:https://www.cnblogs.com/iwehdio/ 1、定义 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。 对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布。然后基于此模 ...
分类:
编程语言 时间:
2019-12-15 18:53:20
阅读次数:
119
统计学习方法与Python实现(二)——k近邻法 iwehdio的博客园:https://www.cnblogs.com/iwehdio/ 1、定义 k近邻法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决的方式进行预测。k近邻法不具有显 ...
分类:
编程语言 时间:
2019-12-09 21:36:02
阅读次数:
87
以统计学习方法(李航)这本书的例子为基础 需要注意的地方: 1. 我用的是pycharm 3. python版本是3.7 2. graphviz是一个软件, "在pycharm里面下了还得去官网下" 下完之后得加入环境变量可能还需要重启电脑 4. 缺啥库就安啥库 5. 那个数据是我自己设置的,手敲的 ...
分类:
其他好文 时间:
2019-11-30 14:04:08
阅读次数:
256
本节内容主要参考于微信公众号"CS的陋室"的相关内容。 一 作者的NLP学习之路1 机器学习:《统计学习方法》,雷明的《机器学习与应用》,塞巴斯蒂安的《Python机器学习》,sklearn的API文档 深度学习:黄文坚《tensorflow实战》,tensorflow技术解析与实战,《keras深 ...
分类:
其他好文 时间:
2019-11-27 00:33:37
阅读次数:
58
统计学习中的相关性 皮尔逊相关系数( Pearson correlation coefficient): 度量两个变量X和Y之间的相关(线性相关) 斯皮尔曼相关性系数(spearman correlation coefficient): 先将样本转化为等级变量,如90分为等级1,然后使用上面相关系数 ...
分类:
其他好文 时间:
2019-11-18 22:02:57
阅读次数:
161