又是考得惨不忍睹的一次 最近这个状态真的是……1.简单的数列 不想怎么说的一道题目 无奈qwq 考场忘开longlong痛失30分可以显然发现这是个跟求逆序对那类题目有些相似的玩意儿考场想到了树状数组 然而实在是忘得差不多QAQ!注意 近期不能只往前赶了!还要时不时复习一下之前的! 1 #inclu ...
分类:
其他好文 时间:
2017-03-25 21:44:43
阅读次数:
204
问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male", "female"]["from Europe", "from US", "from As...
分类:
其他好文 时间:
2017-03-10 18:26:33
阅读次数:
960
catalogue 1. 数据集 0x1: IMDB影评数据 本数据库含有来自IMDB的25,000条影评,被标记为正面/负面两种评价 返回值两个Tuple,(X_train, y_train), (X_test, y_test),其中 0x2: 数据预处理 影评已被预处理为词下标构成的序列,单词的 ...
分类:
数据库 时间:
2017-02-28 15:20:04
阅读次数:
957
在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值、异常值、不一致的值、重复数据及含有特殊符号(如#、¥、*)的数据 数据清洗:删除原始数据集中的无关数据、重复数据、平滑噪声数据、处理缺失值、异常值等 缺失值处理:删除记 ...
分类:
编程语言 时间:
2017-02-28 00:21:38
阅读次数:
2813
catalogue 1. 训练集 训练集以对话集合[2] + 问题[1] + 回答[1]的形式组成 Relevant Link: 2. 数据预处理 0x1: 词汇表 词汇表是语料向量化的一个基础,用来将单词映射到向量空间 0x2: 训练集编码 根据词汇表将对话 + 问题 + 答案进行数字向量化编码 ...
分类:
其他好文 时间:
2017-02-27 21:17:01
阅读次数:
1686
1.准备工作: 定义AAL模板26个小脑作为ROI: 这样得到原始91AAL 因为Mask不匹配,所以需要重采样。 2,resample 打开后,Data Directiory 选择刚得到的90AAL数据,OutputDir 选择存放数据: 这样既可得到重采样后小脑90AAL数据。以此类推,我们便可 ...
分类:
其他好文 时间:
2017-02-20 18:44:14
阅读次数:
345
摘要: 1.正则化(Regularization) 1.1 正则化的目的 1.2 正则化的L1范数(lasso),L2范数(ridge),ElasticNet 2.归一化 (Normalization) 2.1归一化的目的 2.1归一化计算方... ...
分类:
其他好文 时间:
2017-01-19 02:42:43
阅读次数:
801
对数据按列属性进行scale处理后,每列的数据均值变成0,标准差变为1。可通过下面的例子加深理解: 测试数据: 使用sklearn进行scale处理时,有两种方式可供选择。 方式1:直接使用preprocessing.scale()方法: 得到的X_scaled中每列的均值为0,方差为1 方式2:使 ...
分类:
其他好文 时间:
2017-01-16 00:06:08
阅读次数:
498
原文链接 简介 为发挥 SIMD1 的最大作用,除了对其进行矢量化处理2外,我们还需作出其他努力。可以尝试为循环添加 #pragma omp simd3,查看编译器是否成功进行矢量化,如果性能有所提升,则达到满意状态。 然而,可能性能根本不会提升,甚至还会降低。 无论处于何种情况,为了最大限度发挥 ...
分类:
其他好文 时间:
2016-12-30 16:58:00
阅读次数:
286
1、定义目标 调研业务目标 评析环境 确定挖掘目标 制定计划2、数据理解 收集原始数据 探索数据 检验数据质量3、数据准备 数据选取 抽取建模数据 数据预处理4、建立模型 选择建模技术 建立模型 评估和改进模型 模型评价5、部署实施 制定实施计划 模型实施 项目总结和评价 ...
分类:
其他好文 时间:
2016-12-12 19:47:43
阅读次数:
191