1、基本原理 S 表示一连串特定顺序排列的词 , ,…, 使用链式法则计算词序列 S 发生的概率 由于上述条件概率过于复杂,因此引入马尔科夫假设 马尔科夫假设:第 I 个词仅与前面的 k 个词有关 取 k=1,将上式简化为 计算 对大量文本进行阅读,并统计得到 在文本中出现的概率 词序列 在文本中出 ...
分类:
其他好文 时间:
2020-07-21 22:21:39
阅读次数:
73
一、基本术语 1.18泛化:学得模型是否适用于新样本的能力 注:假设样本空间的全体样本服从于一个未知的分布D,我们得到的样本都是独立从D上采样得到的,即“独立同分布”。训练样本越多,地道道关于D的信息越多,也就也可能通过学习得到强泛化能力的模型 1.19归纳:从特殊到一般的“泛化”过程 1.20演绎 ...
分类:
其他好文 时间:
2020-07-21 01:21:58
阅读次数:
82
@ 一、马尔科夫随机场定义 二、一个简单的例子 ...
分类:
其他好文 时间:
2020-07-21 01:16:36
阅读次数:
73
sklearn的数据集 数据集划分 数据集接口介绍 数据集划分 前提:机器学习就是从数据中自动分析获得规律,并利用规律对未知数据进行预测。换句话说,我们的模型一定是要经过样本数据对其进行训练,才可以对未知数据进行预测的。 问题:我们得到数据后,是否将数据全部用来训练模型呢? 当然不是!因为我们如果模 ...
分类:
其他好文 时间:
2020-07-21 01:08:37
阅读次数:
86
以Python撰写AI模型框架by高焕堂前言:在AI(人工智慧)方面,由于当今的机器学习本质是一种<大数据相关性支撑的>归纳性推理。软体框架的复用(Reuse)性愈高,对于应用开发的帮助愈大。因此,在AI领域里,软体框架魅力将会大放异彩。在本文里,是基于最简单的Perceptron模型来阐述如何分析、设计及实作一个框架和API。在本节里,将优化这个AI模型,让它从线性分类,提升到非线性
分类:
编程语言 时间:
2020-07-19 11:27:56
阅读次数:
62
做机器学习的时候经常用到XGB,简单记录一下 K折交叉验证也是模型常用的优化方法。一起记录。。。 K折交叉验证:类似三个臭皮匠,顶个诸葛亮。我的理解是,就是用民主投票的方式,选取票数最高的那个当结果。K折就是分成K份数据来进行。K= 5就是5折交叉验证,K= 7就是7折交叉验证,K=10就是10折。 ...
分类:
其他好文 时间:
2020-07-18 22:48:42
阅读次数:
81
Keras之队鸢尾花识别 任务目标 对鸢尾花数据集分析 建立鸢尾花的模型 利用模型预测鸢尾花的类别 环境搭建 pycharm编辑器搭建python3.* 第三方库 numpy pandas sklearn keras 处理鸢尾花数据集 了解数据集 鸢尾花数据集是一个经典的机器学习数据集,非常适合用来 ...
分类:
其他好文 时间:
2020-07-18 16:10:24
阅读次数:
128
#一、实验目标 在掌握基于Weka工具的数据挖掘(分类、回归、聚类、关联规则分析)应用的基础上,实现基于Weka API的数据挖掘程序设计。 #二、实验内容 1.下载安装JDK 7.0 64位版,Weka 3.7版,Eclipse IDE for Java Developers 4.0以上版本。 2 ...
分类:
其他好文 时间:
2020-07-18 00:35:51
阅读次数:
87
机器学习是比较非常不错的发展领域,而python和R语言在机器学习中都可以应用,因此很多人都会疑惑python和R语言哪个更适合机器学习呢?我们来看看吧。
分类:
编程语言 时间:
2020-07-17 22:32:56
阅读次数:
128
#多变量线性回归(Linear Regression with Multiple Variables) ##4.1多维特征 多维特征就是有多个特征,比如房价模型中增加房子的楼层数等等,模型的特征为$\left( {x_{1}},{x_{2}},...,{x_} \right)$ \(n\) 代表特征 ...
分类:
其他好文 时间:
2020-07-17 22:17:36
阅读次数:
80