码迷,mamicode.com
首页 > 其他好文 > 详细

模型自动化运行利器——IBM SPSS Modeler Batch

时间:2016-05-27 15:03:53      阅读:816      评论:0      收藏:0      [点我收藏+]

标签:spss modeler   数据挖掘   数据分析   数据处理   大数据   

技术分享

背景介绍

很多用户都会关注一个问题,就是模型创建完成之后,如何自动化运行模型,因为不可能每次要运行都要打开SPSS Modeler客户端,点击“运行”,那么今天这篇文章就给大家介绍下通过IBM SPSS Modeler Batch批处理模式实现自动化运行模型的过程。

IBM SPSS Modeler Batch可以实现不需要打开IBM SPSS Modeler客户端,不需要用户干预就可以自动地周期性地运行任务, 需要注意的是,IBM SPSS Modeler Batch必须是有购买IBM SPSS Modeler Server才能够附带有的功能。

批处理模式简介

适用于批处理模式的任务包括:

  • 在后台运行比较耗时的建模训练;

  • 在计划的时间(例如在夜间,此时计算机上的任务运行不影响白天的服务器资源占用)运行预测任务;

  • 针对大量数据运行数据预处理(例如在后台或夜间运行);

  • 运行定期的计划任务,例如每周/月报告;

在批处理模式下工作

在批处理模式下工作通过包括:

  • 使用clemb命令以批处理模式调用IBM SPSS Modeler

  • 连接到服务器

  • 加载现有的流或脚本文件

  • 执行流或脚本

实例介绍

3.使用Windows操作系统的计划任务程序调用druglearn.bat文件。

以下介绍最常用的连接IBM SPSS Modeler服务器,调用.str流文件自动执行的实现步骤。

1.使用IBM SPSS Modeler 创建了流文件 druglearn.str,并保存在C:\wing目录下。

技术分享

该数据流文件中,源是数据库,最终分析结果是导出到Excel文件。

2.编写batch文件,先打开文本编辑器,输入以下内容,并以 .bat为后缀保存起来。

clemb -hostname myserver -port 80 -username dminer -password 1234 -stream"C:\wing\druglearn.str"-P:databasenode.datasource={"POC",sa,123456,true} -execute -logreport32.log

以下对每个参数进行解释:

  • clemb是调用命令;

  • server是连接的IBM SPSS Modeler服务器名称

  • port是连接的IBM SPSS Modeler服务器端口号

  • username是登陆IBM SPSS Modeler服务器用户名

  • password是登陆IBM SPSS Modeler服务器密码

  • stream是指向要调用的流文件(包括路径和流文件名称)

  • P:databasenode.datasource是流文件中,源节点数据库连接所需要的信息,包括ODBC连接配置的名称、数据库用户名、数据库登陆密码

  • excute是表示执行

  • log表示输出日志文件到report32.log

在每个参数前面,都以符号“-”分隔。

在触发器面板上,设置为每周六晚上22:00执行,如下图

技术分享

在操作面板上,选择刚才保存好的druglearn.bat文件。

技术分享

确定后则完成了设置计划任务。

其它参数内容

IBM SPSS Modeler Batch所使用的参数可以非常灵活,除了我们实例中用到的命令参数,还可以是流文件中自定义的参数,想了解更多内容,可在网站上下载试用IBM SPSS Modeler并查看相关的用户手册。

模型自动化运行利器——IBM SPSS Modeler Batch

标签:spss modeler   数据挖掘   数据分析   数据处理   大数据   

原文地址:http://11656151.blog.51cto.com/11646151/1783755

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!