码迷,mamicode.com
首页 >  
搜索关键字:数据预处理    ( 485个结果
CNN- 数据预处理
对于CNN输入的数据,常见的有三种处理方式: 1.Mean subtraction. 将数据的每一维特征都减去平均值。在numpy 中 X -= np.mean(X, axis = 0) 2.Normalization 归一化数据,使数据在相同尺度。 在numpy 中 X /= np.std(X, ...
分类:其他好文   时间:2016-05-27 14:34:36    阅读次数:834
使用K近邻算法实现手写体识别系统
目录 1. 应用介绍 3 1.1实验环境介绍 3 1.2应用背景介绍 3 2. 数据来源及预处理 3 2.1数据来源及格式 3 2.2数据预处理 6 3. 算法设计与实现 7 3.1手写体识别系统算法实现过程 7 3.2 K近邻算法实现 7 3.3手写体识别系统实现 7 3.4算法改进与优化 8 4. 系统运行过程与结果展示 8 1.应用介绍 1.1实验环...
分类:编程语言   时间:2016-05-18 19:36:03    阅读次数:466
CS231n笔记4-Data Preprocessing, Weights Initialization与Batch Normalization
Data Preprocessing, Weights Initialization与Batch NormalizationData Preprocessing Weights Initialization与Batch Normalization 数据预处理Data Preprocessing 权重初始化Weights Initialization 让权重初始化为0 0方差1e-2标准差 0方差1标...
分类:其他好文   时间:2016-05-18 19:27:31    阅读次数:241
使用 R 语言挖掘 QQ 群聊天记录
1、获取数据 从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件。这里获取的是某群从 2016-04-18 到 2016-05-07 期间的聊天记录,记录样本如下所示。 2、数据预处理 打开 R 软件,先通过 File—>Change dir 切换到聊天文件所在目录。 引入包: 没 ...
分类:编程语言   时间:2016-05-16 14:08:40    阅读次数:335
使用Python做单机特征工程
目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 无量纲化与正则化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 ...
分类:编程语言   时间:2016-05-02 18:31:47    阅读次数:476
Python下的机器学习工具scikit-learn--数据预处理
1.数据标准化(Standardization or Mean Removal and Variance Scaling) 进行标准化缩放的数据均值为0,具有单位方差。 同样我们也可以通过preprocessing模块提供的Scaler(StandardScaler 0.15以后版本)工具类来实现这 ...
分类:编程语言   时间:2016-04-27 00:06:50    阅读次数:527
用linux的shell脚本把目录下面的所有文件的文件内容中的小写字母改成大写字母
最近工作中,产品组的同事给出的数据里面都是小写字母 ,但是引擎组的同事要求他们拿到的从数据里面解析出的结构体里面存储的要都是大写结构,这让我们数据预处理组很尴尬啊,,所以在写了个这么样的脚本,在解析数据之前,先使用shell脚本处理一遍数据... ...
分类:系统相关   时间:2016-04-16 18:13:02    阅读次数:253
R语言进行数据预处理wranging
R语言进行数据预处理wranging li_volleyball 2016年3月22日 R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with R data wrangling with R used packagesP:tid ...
分类:编程语言   时间:2016-04-13 07:05:22    阅读次数:231
推荐6个非常好的开源数据挖掘工具
1、RapidMiner 该工具是用Java语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。 另外,除了数据挖掘,RapidMiner还提供如数据预处理和可视化、预 ...
分类:其他好文   时间:2016-04-11 13:46:19    阅读次数:97
阿里音乐流行趋势预测大赛一起做-(2)weka初识
本次比赛第一赛季我们团队大赛先用weka对数据进行预处理。weka是一款开源的,免费的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。我非常喜欢这个软件,很容易上手,功能很强大,也不需要很多的编程,图形化做的比较好。打算在数据预处理上主要使用weka。weka下载安装weka软件下载网址,根据自己的操作系统选择Windows还是Mac...
分类:其他好文   时间:2016-04-10 14:50:33    阅读次数:175
485条   上一页 1 ... 39 40 41 42 43 ... 49 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!