特征提取(机器学习数据预处理) 特征提取与特征选择都是数据降维的技术,不过二者有着本质上的区别;特征选择能够保持数据的原始特征,最终得到的降维数据其实是原数据集的一个子集;而特征提取会通过数据转换或数据映射得到一个新的特征空间,尽管新的特征空间是在原特征基础上得来的,但是凭借人眼观察可能看不出新数据 ...
分类:
其他好文 时间:
2019-09-11 11:31:08
阅读次数:
293
https://blog.csdn.net/zpxcod007/article/details/80118580 制作A卡,申请评分卡 数据集:15万个样本,特征 主要预处理手段:缺失值,异常值,样本不平衡的处理,划分数据集,做分箱处理(离散化),将样本的每个特征都映射到WOE空间 之后建模,这里采 ...
分类:
其他好文 时间:
2019-09-11 11:29:33
阅读次数:
216
简介 kruskal重构树是对kruskal算法的拓展,可以看为一种特殊的数据结构。 实践中可以解决一系列涉及可达点的问题。(这话讲了估计也看不懂) 实现思路 在kruskal算法的流程中,当我们将两个点连接在一起时,不进行直接的连接,而是新建一个节点,然后分别连上。 我们将这个节点的点权设为原先两 ...
分类:
其他好文 时间:
2019-09-10 23:22:20
阅读次数:
98
"poj3494" 思路:一行一行看,所在位置上1的高度先预处理出来,就成了经典单调栈问题 c++ include include include include include include include include include include include include usin ...
分类:
其他好文 时间:
2019-09-09 22:45:54
阅读次数:
76
题意:给定一个字符串,q次询问,每次询问给定一个数k,查询原串的所有不同子串中字典序第k小的子串在原串中的开始和结束位置,若有多个答案则输出最小的开始位置,不存在输出0 0 后缀自动机经典问题,所以我用后缀数组 预处理sum数组记录不同字符串的个数,即sum[i] = len - sa[i] + 1 ...
分类:
编程语言 时间:
2019-09-09 22:35:04
阅读次数:
108
[TOC] GCC 基础知识 一、GCC编译选项解析 1、 常用编译选项 命令格式:gcc [选项] [文件名] E:仅执行编译预处理; S:将C代码转换为汇编代码; c:仅执行编译操作,不进行连接操作; o:指定生成的输出文件。 2、gcc编译的四个阶段(ESc,iso) 1、将hello.c预处 ...
分类:
其他好文 时间:
2019-09-09 19:10:45
阅读次数:
78
writer注: 这里的板子,不止是算法和数据结构的板子,还包括各种预处理、代码技巧等。 OI比赛中, 以做题来得分。 不考虑开题顺序以及拿分意向, 做一道题目的步骤一般分解为 思考、 编写、 验证(对拍)。 不考虑验证的时间, 通常思考占的时间较多,这时就需要较快且较准确地编写代码。(算法、数据结 ...
分类:
其他好文 时间:
2019-09-08 20:22:23
阅读次数:
108
题面 首先,预处理,把每条边反向。 从终点开始bfs,标记从终点开始可以走到的点。 第二步,枚举每一个点,如果这个点没有被标记,则枚举它的每一条出边(反向后的),如果它指向的点被标记,则说明这个被标记的点不合法,删除。 第三步,在合法点上bfs,单源最短路。 ...
分类:
其他好文 时间:
2019-09-08 14:21:13
阅读次数:
71
[toc] hello.c 1. 预处理阶段:预处理器(cpp) 2. 编译阶段:编译器(ccl) 3. 汇编阶段:汇编器(as) 4. 链接阶段:链接器(ld) ...
分类:
其他好文 时间:
2019-09-07 00:36:57
阅读次数:
100
P3379 【模板】最近公共祖先(LCA) 用欧拉序$+rmq$维护的$lca$可以做到$O(nlogn)$预处理,$O(1)$查询 从这里剻个图 ...
分类:
其他好文 时间:
2019-09-05 23:23:32
阅读次数:
118