润乾集算报表提升性能之可控缓存

时间：2014-11-21 16:44:26 阅读：204 评论：0 收藏：0 [点我收藏+]

使用缓存可以提升报表性能是不争的事实，一般高端报表工具都会提供报表缓存的功能，用于将整个报表计算结果缓存到文件系统中，以便用户在下次访问同参数报表时可以快速读取缓存结果进行报表展现，集算报表也具有这种常规缓存功能。但是，有些情况下报表开发人员希望能够控制缓存的内容，比如有时希望缓存的不是整个报表结果而是其中的部分，有时缓存内容可被其它报表或程序复用，有时希望对不同的缓存结果设置不同的超时时间，以应对数据量和实时性方面的不同情况。这时，一般的报表缓存就无法满足需求了。

集算报表内置了可编程的数据计算引擎，允许开发人员灵活控制缓存内容。这里我们将开发人员在使用集算报表开发中可以控制的缓存内容称为可控缓存。可按缓存可以带来更大的灵活性和好处，下面就前述提到的三点展开来说。

缓存部分结果

在报表开发中，有时并不希望将所有报表结果进行缓存，这样可以避免耗费过高的缓存成本（磁盘空间和应用服务器资源开销）。另外，当报表中的部分数据实时性要求很高，需要实时与数据库交互进行数据查询，那么这部分数据就不适合进行缓存，这时通过集算报表的可控缓存就可以将变化不太频繁的中间结果缓存起来。报表再次请求时，实时性要求高的数据仍然实时从数据库中读取，并结合缓存中的数据进行报表计算，得到最终报表结果集。常规缓存方案没有这种缓存部分结果的功能，只能设置整个报表是否进行缓存，这样在报表涉及各部分数据的时效性不同时就会发生矛盾；而集算报表在这方面更加灵活，效率更高。

缓存结果复用

集算报表中可控缓存是可以复用的，一个报表的缓存结果（部分或全部）可以被其他报表或程序读取并使用，而不必再次缓存同样的结果（常规报表缓存方案则会重复），这会大幅度提供整体缓存的效率。与缓存部分结果适应实时性要求的情况类似，当其他报表或程序使用某个报表的缓存结果时，只需要从缓存中（一般是磁盘文件）读取，并与报表中其他数据来源（可能是DB、文件，或是另一个报表的缓存）进行混合运算最终得到报表结果集。常规的报表缓存则是以报表模板为单位单立的，彼此无法复用，会造成一定的资源浪费以及增加一定的性能开销，而集算报表在这方面更加灵活，效率更高。

设置不同超时时间

我们都熟知的缓存一定会有超时时间，超时时间外缓存会被清除，报表访问时重新生成缓存文件。一般的报表工具的缓存超时时间会在配置文件中设置，如3600s或7200s，这种设置对应用中的报表在所有参数情况甚至所有的报表均有效，换句话说，整个报表甚至整个系统必须使用同样的设置。

然而，事实并不希望这样，如果能够针对不同的报表场景设置不同的超时时间，那样会更有效。比如，针对大量的历史数据查询的报表，由于历史数据的变化不大，我们希望报表的缓存结果可以保存较长时间，以便每次查询时都能从缓存中快速读取结果，这时需要设置较长的超时时间；而针对数据变化频繁，实时性要求较高的报表则超时时间会较短，以便满足数据的实时性要求。

集算报表的结果缓存允许开发人员针对不同的报表设置不同的超时时间，以应对上述提到的报表场景。同样，这种做法提供了更高的灵活性，使得报表缓存达到真正意义上的人为可控。

举例

具体实现上可以参考集算报表的相关文档资料，这里通过一个例子简单说明结果缓存的使用方法，可以参考如下步骤（举例说明）：

1、使用集算报表内置的集算器编写脚本生成/读取缓存文件，这个过程处于报表数据源的计算阶段。