码迷,mamicode.com
首页 >  
搜索关键字:数据清理    ( 130个结果
[MDB] 清理历史数据
mdb拆分数据清理zg/ngboss4,123@ngtst02select 'drop table ' ||TABLE_NAME ||';' from all_tables where table_name LIKE 'FYL_%';入库详单清理jf/jf@ngtstdb196select * fr...
分类:数据库   时间:2015-09-08 12:26:04    阅读次数:166
知识发现过程
1. 数据清理 (消除噪声和不一致数据)2. 数据集成 (多种数据源可以组合在一起)3. 数据选择 (从数据库中提取与分析任务相关的数据)4. 数据变换 (数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作)5. 数据挖掘 (基本步骤,使用智能方法提取数据模式)6. 模式评估 (根据某种兴趣度度量...
分类:其他好文   时间:2015-08-19 12:47:03    阅读次数:152
《R语言实战》读书笔记--第一章 R语言介绍
1、典型的数据分析过程可以总结为一下图形: 注意,在模型建立和验证的过程中,可能需要重新进行数据清理和模型建立。 2、R语言一般用 也可以。 3、 age <- c(1,3,5,2,11,9,3,9,12,3) weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4...
分类:编程语言   时间:2015-07-31 21:36:55    阅读次数:209
pandas 学习笔记
读者只需浏览一下本文的目录结构,我相信就已经掌握了1到2成的 pandas 知识。本文的目的是建立一个大概的知识结构在数据挖掘python阅读源码时,断断续续查阅了些 pandas 资料,并在源码中大致感受到了 pandas 在数据清理方面的方便性。先将自己查阅的资料结合实际应用中常用到的方式,以学习笔记的形式整理出来。不会涉及到 pandas 的所有方面,细节知识还需自行查阅官方文档。数据结构 S...
分类:其他好文   时间:2015-07-28 23:10:56    阅读次数:168
CleanMyMac—最好的苹果清理软件
CleanMyMac走进我们视线有一段时间了,很多用户已经体验过CleanMyMac3更加强大的功能和更加人性化的设计,最新版本不仅新增了 一目了然的邮件附件清理,iTunes?垃圾清理,脚本维护,隐私数据清理四个功能,更是新...
分类:移动开发   时间:2015-07-10 17:10:59    阅读次数:204
数据挖掘一般过程
目录1.数据集选取2.数据预处理(1)数据清理(2)数据集成(3)数据归约(4)数据变换和数据离散化3.数据分析算法4.分析总结改进 这学期提前选课学习了DataMining,最近提交了论文已经彻底结了。想来想去还是写点东西记一下,假如以后能用上呢?仅供参考哈参考书:《数据挖掘概念与技术》Jiaw....
分类:其他好文   时间:2015-06-29 16:12:22    阅读次数:188
SSISDB数据清理2
从网上找了一个可以清理SSISDB数据的存储过程,创建之后,直接执行存储过程就好CREATE PROCEDURE [internal].[cleanup_server_retention_window_truncateall]AS SET NOCOUNT ONDECLARE @enable_cle....
分类:数据库   时间:2015-06-25 10:24:41    阅读次数:490
数据挖掘相关免费软件
转载自http://reader.dashuai.net/?p=100数据清理类工具DataWranglerGoogle Refine统计分析类工具The R Project for Statistical ComputingTimeFlow数据展现类工具Google Fusion TablesIm...
分类:其他好文   时间:2015-05-29 13:46:25    阅读次数:129
一起数据库中过期用户数据堆积问题的排查过程
【文章摘要】对于使用数据库来存放大量用户的软件来说,过期数据的清理机制需要慎重设计。如果设计不当,则会导致数据的误删除或清理不完全。本文对某数据清理模块因参数配置不当而导致的过期用户数据堆积问题进行了详细的分析,为相关软件问题的分析及解决提供了有益的参考。 一、问题描述在某软件系统中,为了让不同种类的用户享受对应的服务,引入了一个信箱服务等级的概念,即不同服务等级的用户具有不同的权限。“一分钱,一...
分类:数据库   时间:2015-05-04 20:14:36    阅读次数:154
新浪微博爬取笔记(4):数据清理
数据清理的部分很多,其实爬数据的过程中步骤的间隔也要做数据清理,都是很琐碎繁杂的工作。总结经验的话,就是:1、一定要用数据库存储数据 (我因为还不太会数据库,为了“节省学习时间”,所有数据项都用txt存储,直到最后出现了多个种类之间查找,文件夹树变得比较复杂,才觉得当初即使使用MySQL也会提高效率...
分类:其他好文   时间:2015-04-25 22:32:53    阅读次数:255
130条   上一页 1 ... 9 10 11 12 13 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!