商业智能与报表自动化
首先先说说商业智能与报表自动化。
商业智能是(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。(百度百科)
报表自动化呢?是指将传统的人工整理报表(excel)的过程实现自动化,比如统计出当月销售总额,自动化的报表可以自动根据当月的所有销售订单记录自行计算出这个当月销售总额信息,而不需要像传统方式手动整理-统计数据。
商业智能 ≠ 报表自动化,可以说报表自动化是商业智能的一个基础,只有先将大量的数据实现自动化的处理、汇总、统计才能进一步的进行商业智能的实践。
上面说到报表自动化是商业智能的基础,那么还需要什么?看看百度百科的介绍可以明确的知道肯定还要数据挖掘,但这一步相对较为复杂,逐步实现商业智能的过程中我们更期待的是在实现过程中能够持续的产生价值,我认为可以分为如下几步
报表自动化
既然报表自动化是商业智能的基础,那么先实现它,这一步的价值是什么?
- 释放劳动力:在数据如此庞、杂的时代,任何一个企业都会有各种各样的数据,相对简单的统计可能只需要分析一类数据,但稍微复杂一些就会产生多类数据的融合或者是在时间线上的复杂分析,这时候就需要庞大的人力资源开销了,实现自动化可以直接的降低此部分的重复开发。注意是“重复”。
- 降低错误率:自动化意味着通过编码的手段持久化流程、逻辑,当我们调试正确一次后,那么我们就可以信任这个工具了,我相信再重复劳作场景下机器的稳定产出率要比人更加可靠。
- 时效性高:除了每个月报表的报表,我们还可以考虑实现在每一天统计当月的情况,实时的汇总每日信息以动态的调控月度计划。
数据图表化
饼状图、折线图、柱状图……这里我提到的是图表化,并不是一步到达可视化,甚至可视化大屏的级别。
为什么先有个图表化呢?虽然只是一小步,但是绝对可以很大程度的提高对数据的利用率,图表可以帮我们初步的可视化
- 数字直观化:以一个超市举例,我们如果只是单纯的看到当月肉类销售 100 万元,蔬菜销售 50 万元,日用品销售量 75 万元这样的描述信息是无法直观的感受到不同类目数据在当月的占比的,但是如果用饼状图就可以很清晰的看到当月收入占比,同样的也可以统计各类目的销售量占比等等
- 理解快速:直观化只是看起来好,实际上直观还可以帮助我们更快的理解,图表相比于数字的来说,更多人可以感知出其中的信息
- 初步固化数据理解方法:为什么说是固化?一个一个数字独立的摆在屏幕上,他们之间的联系是什么?谁和谁需要聚合分析?通过图表可以将业务需要或者数据专家对数据的敏感性固化,将他们发现的数据之间的关系持久化为代码以固定的图表进行展示,让任何使用者都可以看到数据以及数据间的关系。
- 初步的数据趋势可观察性:用上面超市的例子,每个月生成一个饼状图,我们可以在有分类销售额有较大变动时直观看出来;除此以外,还可以把每个分类的单独绘制 by 月份的折线图来看不同季度销售情况,通过折线的波动情况有可能发现一定的规律,以供进行下个月备货量的安排
数据可视化
图表化和可视化是什么关系呢?实际上图表化已经是初步的可视化了,但是一两个图表可以快速的理解,几十个呢?信息过多就需要分类,我们可以这么做。
图表聚合
我们需要合理的处理图表之间的关系,虽然说一张图表可以显示多种数据甚至多个维度的信息,但是一个图标能表示的内容终究是有限的,我们可能需要将多个图表组合显示,这种组合的关系可能是:
- 根据业务组合:继续说超市,我们可以根据销售情况、上游供货商情况、员工管理情况等多种不同的业务进行分类、分组,将报表进行组合,在一个可视区域里显示这一类报表以便于综合分析
- 根据价值组合:在管理上有打破部门壁垒的需要,在数据可视化这里也是一样的,超市的进货与销售情况会有一定的联系,有些货品的销售速度可能受到当日推销员工数量、当日进店客户数量的影响,将这些可能互相影响的数据根据一定关系 / 计算公式进行统计,得出有价值的信息,比如转化率一类的业绩指标
- 根据敏感信息组合:有些信息可能很敏感需要汇聚到一起进行显示,比如超市即将过期的物品
- ……
显示效果优化
当我们把各种信息汇总并展示后,还需要针对数据做一定的美化
- 涉及到地域的信息可以以地图的形式展示;
- 涉及到多维度的可以以多边形的方式直观的看到同一阶段各维度的评估分值;
- 比率一类的信息可以用彩色的条状或者环形展示,除了能看到比率还可以通过颜色直接给人示警的作用
- ……
最终我们就得到了“可视化大屏”,比如下图的效果
(图片来源 帆软 的首页介绍,侵删)
数据挖掘
我们的数据帮我们记录了各种历史数据,这代表的是过去。
过去,现在,未来三个神奇的词语将难以处理的时间都囊括其中,一个点+两个射线让我们看起来掌握了所有时间,我们现在通过数据拿到了过去,现在正在做的也许眨眼就会过去,那么能够改变的就是未来了。虽然说了是个射线,但是未来是模糊的,它到底指向何方?我们用什么指引?这时候可能过去的数据会给我们一些“暗示”,
通过报表我们能看出来一些趋势,对于人眼直观观察来说,我们可能更能看出折线图表现出来的趋势,但是趋势如何量化?
除此以外其他形式的报表,甚至那些没有整理成报表的数据之间的规律呢?
这时候可以进行数据挖掘,以多种分析方式找到数据之间的潜在联系,让数据产生更大的价值。
最后
总要有个结尾吧
本文主要讲了我认为的如何逐步做到商业智能,通过报表自动化、数据图表化、数据可视化、数据挖掘四步走的方式,逐步的让数据产生价值。
当然这只是这一系列文章的开头,我更想说的是第一步,报表自动化如何做,后面几篇文章逐步的讲解我对报表自动化的理解、报表系统的一种设计方式、数据仓库维度建模过程及我的实践经历。