标签:spss modeler 数据挖掘 数据分析 数据处理 大数据
很多用户都会关注一个问题,就是模型创建完成之后,如何自动化运行模型,因为不可能每次要运行都要打开SPSS Modeler客户端,点击“运行”,那么今天这篇文章就给大家介绍下通过IBM SPSS Modeler Batch批处理模式实现自动化运行模型的过程。
IBM SPSS Modeler Batch可以实现不需要打开IBM SPSS Modeler客户端,不需要用户干预就可以自动地周期性地运行任务, 需要注意的是,IBM SPSS Modeler Batch必须是有购买IBM SPSS Modeler Server才能够附带有的功能。
适用于批处理模式的任务包括:
在后台运行比较耗时的建模训练;
在计划的时间(例如在夜间,此时计算机上的任务运行不影响白天的服务器资源占用)运行预测任务;
针对大量数据运行数据预处理(例如在后台或夜间运行);
运行定期的计划任务,例如每周/月报告;
在批处理模式下工作通过包括:
使用clemb命令以批处理模式调用IBM SPSS Modeler
连接到服务器
加载现有的流或脚本文件
执行流或脚本
3.使用Windows操作系统的计划任务程序调用druglearn.bat文件。
以下介绍最常用的连接IBM SPSS Modeler服务器,调用.str流文件自动执行的实现步骤。
1.使用IBM SPSS Modeler 创建了流文件 druglearn.str,并保存在C:\wing目录下。
该数据流文件中,源是数据库,最终分析结果是导出到Excel文件。
2.编写batch文件,先打开文本编辑器,输入以下内容,并以 .bat为后缀保存起来。
clemb -hostname myserver -port 80 -username dminer -password 1234 -stream"C:\wing\druglearn.str"-P:databasenode.datasource={"POC",sa,123456,true} -execute -logreport32.log
以下对每个参数进行解释:
clemb是调用命令;
server是连接的IBM SPSS Modeler服务器名称
port是连接的IBM SPSS Modeler服务器端口号
username是登陆IBM SPSS Modeler服务器用户名
password是登陆IBM SPSS Modeler服务器密码
stream是指向要调用的流文件(包括路径和流文件名称)
P:databasenode.datasource是流文件中,源节点数据库连接所需要的信息,包括ODBC连接配置的名称、数据库用户名、数据库登陆密码
excute是表示执行
log表示输出日志文件到report32.log
在每个参数前面,都以符号“-”分隔。
在触发器面板上,设置为每周六晚上22:00执行,如下图
在操作面板上,选择刚才保存好的druglearn.bat文件。
确定后则完成了设置计划任务。
IBM SPSS Modeler Batch所使用的参数可以非常灵活,除了我们实例中用到的命令参数,还可以是流文件中自定义的参数,想了解更多内容,可在网站上下载试用IBM SPSS Modeler并查看相关的用户手册。
模型自动化运行利器——IBM SPSS Modeler Batch
标签:spss modeler 数据挖掘 数据分析 数据处理 大数据
原文地址:http://11656151.blog.51cto.com/11646151/1783755