标签:
数据项目确保数据质量是最重要的事。
但作为开发人员的我,一直对代码的热情远高于数据,这是不应该的。
因为凡是涉及到数据的项目,数据质量的重要性远远比代码重要。
理解数据,比优化代码更重要,只有在保证数据质量的前提下,再优化代码才是锦上添花。
责任心是安全之魂,标准化是安全之本。
还有时候,开发周期比较短,开发人员一急躁,没有做完整的测试,或当时办公室温度比较燥,
引发其心理比较烦躁,就极容易造成代码质量的下降,但这些都不重要,最重要的是我们需要有一个
标准化的测试流程,无论在什么样的情况下,代码输出的数据需要确认,通过了检验才能算完成。
做到测试的标准化,才能让我们对自己的数据质量更放心。
我的一点小技巧,
使用excel拟造少量的数据,人工地根据自己对分析的流程,一步步做出正确的输出。
然后使用代码,一步一步生成数据,跟excel做对比。这样如果能通过代码测试,
在很大程度上就能确定数据的准确性。
因为大数据项目本身数据量比较大,你直接从数据表中去查看数据项目不容易发现的问题,
在数据量小的时候就容易发现了,但有些问题,数据量小的时候发现不了,数据量大的时候就
暴露出来了?这时该怎么办?
标签:
原文地址:http://www.cnblogs.com/huaxiaoyao/p/4391494.html