多样性数据源之文本文件

时间：2015-05-05 14:24:00 阅读：154 评论：0 收藏：0 [点我收藏+]

多样性数据源在报表开发中越来越常见，润乾集算报表对多样性数据源的有效支持使得这类报表开发变得非常简单，目前集算报表支持的数据源类型除传统的关系型数据库外，还支持：TXT文本、Excel、JSON、HTTP、Hadoop、mongodb等。

这里通过两个例子介绍集算报表使用文本数据源制作报表的步骤，对于小文本文件和大文本文件在集算报表中可以采用不同的方式进行处理。

小文本文件

报表说明

股票交易记录按月以文本形式存储，文件名为stock_record_yyyyMM.txt（如stock_record_200901.txt），文本内容包括股票代码、交易日期和收盘价。现根据指定日期精确查询某一只或几只股票的收盘价，以便进行股价趋势分析。文本内容如下：

code tradingDate price

120089 2009-01-0100:00:00 50.24

120123 2009-01-0100:00:00 10.35

120136 2009-01-0100:00:00 43.37

120141 2009-01-0100:00:00 41.86

120170 2009-01-0100:00:00 194.63

报表样式如下：

技术分享

输入查询日期和股票代码，查询到的交易信息：

技术分享

由于某天的股价信息只会存在一个文件中（按月存储），单个文件数据量并不是很大，因而可以将文件一次性加载到内存中完成数据查询。这里我们也将能够一次性读入内存进行计算的文件称为小文本文件。以下为具体实现：

编写计算脚本

使用集算编辑器编写脚本（p1.dfx），完成文件读入和数据过滤，为报表返回结果集。由于要接收报表传递的参数，首先设置脚本脚本参数。

技术分享

编辑脚本内容（右侧为格子运行后结果）：

A1：根据日期参数导入指定文件（一个）；这里使用了f.import()将文本数据一次性读入内存，采用全内存方式完成数据计算，这也是处理小文件的常用方法；

A2：根据指定日期和股票代码查询交易记录；

A3：为报表返回结果集。

编辑报表模板

使用集算报表设计器新建报表模板，并设置参数：

设置数据集，使用“集算器”数据集类型，调用编辑好的脚本文件（p1.dfx）

其中，dfx文件路径既可以是绝对路径，也可以是相对路径，相对路径是相对选项中配置的dfx主目录的。

编辑报表表达式，直接使用集算脚本返回的结果集，不再在报表中过滤，完成报表制作。

通过上面的实现可以看到，使用集算器脚本可以很方便地完成文本文件的读取计算，而且外置的集算脚本具有可视化的编辑调试环境，编辑好的脚本还可以复用（被其他报表或程序调用）。不过，如果脚本已经调试好，而且不需要复用的时候，要维护两个文件（集算脚本和报表模板）的一致性会比较麻烦，这时候直接使用集算报表的脚本数据集就比较简单了。

在脚本数据集中可以分步编写脚本完成计算任务，语法与集算器一致，还可以直接使用报表定义好的数据源（本例并未涉及）和参数。可以这样使用脚本数据集替代集算器数据集（集算脚本）部分（报表参数、表达式等部分与使用集算器数据集时完全一致，不再赘述）：