标签:因此 下一步 电脑 source together rcm 结果 大脑 单表
系列文章:
https://preppindata.blogspot.com/p/how-toprep-index.html
不了解数据,就没法得到想要的分析结果。对于小型的数据集,可以这么做:
可以用笔快速画出目录列和value,来方便理解。
大多数分析工具,都要求把数据放到一个单独的表中,所以分析的数据必须集合在一张表内。
同样画图时理解数据的好办法。
这个阶段不需要电脑,而是你的大脑
在了解原始数据和明确desired State后,下一步就是对数据的规整。clean, pivot, join and aggregate。
列出你需要做的规整,无需太全面,此时还无需建立工作流,而是思考下吗的问题:
Rows
其他问题:
With Tableau Prep, you can quickly change the order of the transitions or add forgotten ones to go from the original data to the Desired Stat。
使用Tableau Prep可以把上面的步骤在电脑上实现。从原始数据到输出结果的顺序也可能变化。
比如拿到这个表:
如何观察?
首先,按照维度和度量来区分列。
??度量值一定是数值型数据。维度值可以是字符串,日期时间。
tableau会把第一行数据当作列名。其余行会作为列的值。
tableau会把列划分到维度和度量。 Dimensions (aspect to split the data up by) , Measures (the data fields to analyse).
度量列的数据类型type一定是数值型的。
上图作为原始数据表,显然需要进行规整才能用desktop进行分析。
我们已经知道什么作为维度,什么作为度量。
??ta bleau希望,行多多的,列少少的。
??表的第一行日期有6个,作为列的话,显然不合适。因此要转置:
转置又分为
本例子:
原表Measure列下有2个值,列转行生成: Sales和Profit.
原表的日期列名,组成一个新列Date.
标签:因此 下一步 电脑 source together rcm 结果 大脑 单表
原文地址:https://www.cnblogs.com/chentianwei/p/12787662.html