硬件维护计算机硬件的维护主要有以下几点:(1)任何时候都应保证电源线与信号线的连接牢固可靠;(2)定期清洗软盘驱动器的磁头(如三个月、半年等);(3)计算机应经常处于运动状态,避免长期闲置不用;(4)开机时应先给外部设备加电,后给主机加电;关机时应先关主机,后关各外部设备,开机后不能立即关机,关机后...
分类:
其他好文 时间:
2014-10-18 15:23:06
阅读次数:
191
为什么要对数据仓库分层?用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个...
分类:
其他好文 时间:
2014-10-09 19:39:37
阅读次数:
528
简介 OLTP系统的后端关系数据库用于存储不同种类的数据,理论上来讲,数据库中每一列的值都有其所代表的特定含义,数据也应该在存入数据库之前进行规范化处理,比如说“age”列,用于存储人的年龄,设置的数据类型为INT类型。存入数据库的值是2000虽然看起来没有任何问题,但结合业务规则,这样的”Nois...
分类:
其他好文 时间:
2014-10-08 11:45:45
阅读次数:
364
一、 大数据基本概念大数据Big Data是指大小超出了经常使用的软件工具在执行时间内能够承受的收集,管理和处理数据能力的数据集;大数据是眼下存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。大数据的预处理主要完毕对已接收数据的辨析、抽取、清洗等操作。(1)抽取:因获取的...
分类:
其他好文 时间:
2014-09-24 22:08:37
阅读次数:
1117
ETL 概念 ETL中三个字母分别代表的是Extract、Transform、Load,即抽取、转换、加载。(1)数据抽取:从源数据源系统抽取目的数据源系统需要的数据;(2)数据转换:将从源数据源获取的数据按照业务需求,转换成目的数据源要求的形式,并对错误、不一致的数据进行清洗和加工。(3)数据加载...
分类:
其他好文 时间:
2014-09-23 20:46:15
阅读次数:
432
写种子清洗机的初衷其实是因为要清洗的种子太多(呵呵),而大多数的清洗机都是web应用,运行在网络上,需要上传下载,占用一定的带宽。另外,就是很少能够提供批量清洗的功能。有些能提供也是有数量限制或者要收...
分类:
其他好文 时间:
2014-09-09 13:56:58
阅读次数:
153
好尔公益每周日召集志愿者到北京市海淀区残联开展各项公益活动,比如:协助打扫卫生、做饭、教孩子画画、手工等。北京好尔超能设备销售有限公司员工在参与好尔公益的过程中,发现海淀区残联孩子们的食品只进行常规清洗,并没有对农残进行特别处理后,马上向公司汇报,公司了解这一情况后,随即联系海淀区残联安排赠送好尔农...
分类:
其他好文 时间:
2014-09-03 12:48:46
阅读次数:
178
机器学习的目标:通过若干实例让机器学会完成任务。统计学是机器学习专家经常研究的一个领域。机器学习的方法不是瀑布式的过程,需要反复分析,探索,尝试。Python被作者认为是一种非常有效的建模语言。一个观点:算法不是最花时间的,花时间的是:1.读取和清洗数据。2.探索和理解输入数据。3.分析如何最好的将...
分类:
其他好文 时间:
2014-09-03 00:11:05
阅读次数:
270
一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程。一方面可以给大家切实的分享一些有用的信息,再者可....
分类:
其他好文 时间:
2014-09-01 22:36:13
阅读次数:
834
上一节我们通过爬虫工具爬取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到错误数据,一个异常抛出来,绝对尸横遍野。而你不能指望核心算法为你处理错.....
分类:
其他好文 时间:
2014-09-01 22:32:33
阅读次数:
347