前言 此文是在本人学习完离散数学中的数理逻辑部分后,对标题中各部分之间的联系存在很大的疑惑。特此进行总结,水平有限,如有错误,欢迎指正。 从逻辑代数开始 逻辑代数是一种用于描述客观事物逻辑关系的数学方法,由英国科学家乔治·布尔 (George·Boole) 于19世纪中叶提出,因而又称布尔代数。 所 ...
分类:
其他好文 时间:
2020-04-04 22:49:26
阅读次数:
95
一、大数据预处理的几个步骤 1.数据预处理 2.数据清洗 3.数据集成 4.数据归约 5.数据变换 6.数据离散化 7.大数据预处理 二、数据预处理 现实中的数据大多是“脏”数据: ①不完整 缺少属性值或仅仅包含聚集数据 ②含噪声 包含错误或存在偏离期望的离群值 比如:salary=“-10”,明显 ...
分类:
其他好文 时间:
2020-04-03 22:15:48
阅读次数:
171
[TOC] 一、根轨迹法 1. 核心思想 (1) 将时域动态指标 超调量σ 、 上升时间tr 及 峰值时间ts 转换为z域指标 阻尼比ξ 、 自然频率wn 及 ξwn ; (2)利用z域指标结合 设计样板图 绘制出特殊区域; (3)设计D(z) ,使得 完整系统 的根轨迹经过该特殊区域即可。( 根轨 ...
分类:
其他好文 时间:
2020-04-02 21:05:38
阅读次数:
136
(1)如果缺值的样本占总数比例极高,我们可能就直接舍弃了,作为特征加入的话,可能反倒带入noise,影响最后的结果了; (2)如果缺值的样本适中,而该属性非连续值特征属性(比如说类目属性),那就把NaN作为一个新类别,加到类别特征中; 【注:NaN(Not a Number,非数)是计算机科学中数值 ...
分类:
其他好文 时间:
2020-04-02 18:16:40
阅读次数:
370
一.基本 1.模型也被称为学习器,学习器更为准确。学习器是指能从已有的数据中学习到所需知识的数学模型。 2.模型分类:按照学习的数据分类, (1)监督学习(supervised learning):训练的数据有标记信息。又由标记信息的 【1】分类:标记信息呈现离散状态。KNN、朴素贝叶斯、逻辑回归、 ...
分类:
其他好文 时间:
2020-04-01 21:01:07
阅读次数:
102
开篇: 从事NLP方向的工作也有一年了,前前后后也学到了很多东西,但是就是没有整理过,现在从原理和应用的方面将所有知识总结方便复习管理。 一、word2vec word2vec可以说得上是NLP的一个里程碑。将每个单词离散表示,既解决了one-hot的巨大维度,也解决了one-hot的部分语义问题。 ...
分类:
其他好文 时间:
2020-03-30 23:45:00
阅读次数:
180
2、 一维随机变量的分布 (1)随机变量 类型 根据取值情况的不同可以将随机变量分为离散随机变量和连续随机变量 概率分布 随机变量一切可能值或范围的概率的规律 (2)常见离散分布 1)两点分布 随机变量X值可能取0和1两个值,则分布为 X 0 1 Pk 1-P P 则称X服从(0--1)分布或者两点 ...
分类:
其他好文 时间:
2020-03-29 17:52:27
阅读次数:
55
https://codeforces.com/contest/1328/problem/F 首先把a数组处理成pair对(num,cnt),表示数字num有cnt个,然后按num升序排序离散化一下。 对于一个数x,若想使得小于x的数字都变成x,必须先把所有小于x的数变成x-1,然后再+1变成x。 同 ...
分类:
编程语言 时间:
2020-03-29 01:15:50
阅读次数:
94
Task3特征工程 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式: log(1+x1+me ...
分类:
其他好文 时间:
2020-03-28 23:48:19
阅读次数:
127
楔子 前两篇我们讨论的离散型和连续型随机变量都是单一变量,然而在现实当中,一个试验常常会涉及到多个随机变量。所谓多个随机变量是指在同一个试验结果之下产生的多个随机变量。这些随机变量的取值是由试验结果确定的,因此它们的取值会存在相互关联。这里我们先以离散型随机变量为例,将离散型随机变量的分布列和期望推 ...
分类:
其他好文 时间:
2020-03-28 20:04:29
阅读次数:
67