在平时工作当中,会遇到这种情况,而且很常见。比如:1、自动生成文件TXT或者EXCEL(电信行业该需求居多),上传至某服务器;2、双方数据对接,对方提供数据库视图针对以上情况,笔者就写下具体怎么实现1、自动生成EXCEL文件1)如上图,选择表输入(读取视图或者table数据),EXCEL输出(准备输出的EXCEL文件),连接两个控件。2)配置数据库连接(上节有介绍jdbc),后续可以通过jndi进
分类:
其他好文 时间:
2020-09-18 00:30:03
阅读次数:
37
一、先下载JDK以及kettle 下载地址:https://pan.baidu.com/s/1k1v7t-1kCJqouoo3aRx5hw 密码:fpxq 二、创建资源库 1、点击Spoon.bat文件,启动kettle. 2、创建资源库 点击Connet,选择Pentaho Repository ...
分类:
其他好文 时间:
2020-09-17 15:43:47
阅读次数:
31
Kettle巧用公式轻松实现数据抽取(图文并茂,带案例讲解)
分类:
其他好文 时间:
2020-08-08 00:40:05
阅读次数:
93
之所以选择4.4.0,因为公司还在用Java6编程…… 但是项目的需求是:实施人员上传kettle的文件,然后在界面上点击运行,运行完之后需要在页面上看日志。 当然 kettle 是自带日志输出功能的,不过我们总不能跟客户说:“你在kettle里面定义好日志输出,然后自己去数据库或者某个文件夹中查询 ...
分类:
编程语言 时间:
2020-07-28 22:15:45
阅读次数:
93
详情见图 etl_bst_agg_zw_tkt_model_d.py 支持传递时间参数,不传递时,默认调度昨天的数据 如:python etl_bst_agg_zw_tkt_model_d.py 20200101 20200102 调度20200101这一天的数据 python etl_bst_ag ...
分类:
编程语言 时间:
2020-07-20 13:26:11
阅读次数:
135
操作步骤 1)TmpBstAggZwTktModelD 按天读取Mysql表数据bst_agg_zw_tkt_model_d,存入hive临时表tmp_bst_agg_zw_tkt_model_d(临时表采用txt格式,按年月日进行分区) 2)HiveBstAggZwTktModelD 连接hive ...
分类:
数据库 时间:
2020-07-20 13:08:14
阅读次数:
129
kettle 经常在调度的时候,会出新重复使用的变量,如果使用一次就去输入一次变量,这样非常的浪费时间。为了解决这一问题,我们将环境变量设置为固定的 1.永久设置环境变量 找到自己电脑上的 .kettle 文件夹 下的repositories.xml 打开文件,文件里面是 kv形式,根据自己的需求填 ...
分类:
其他好文 时间:
2020-07-08 15:02:54
阅读次数:
65
现阶段需要做数据库同步工作,目前调研了两个工具datax和kettle 这两者各有优缺点,基本的就不总结了。现在说说一些关键点: 基本方面: 1.datax适合做数据同步工作;kettle适合数据清洗,转换工作 目前成型的可视化界面,datax推荐datax web,kettle后期维护用的界面推荐 ...
分类:
其他好文 时间:
2020-07-01 12:14:39
阅读次数:
421
背景 公司想要将业务系统使用的数据库由 SQL SERVER 切换到 ORACLE,因此需要将原 SQL SERVER 库的数据同步到 ORACLE 库中。 因为涉及的数据表有几百张,数据约百G的级别,一张表开发一个Kettle 太过于繁琐了,因此考虑通过配置完成数据同步。 方案: SQLSERVE ...
分类:
其他好文 时间:
2020-06-30 20:13:31
阅读次数:
128
如何彻底解决Kettle无法连接MySQL8的缺陷?一、背景在使用Kettle对数据进行处理时,最常见的操作莫过于关系数据库的使用,然而使用最新版本Kettle8常面临以下几个痛点:不支持MySQL8。MySQL是当前最流行的开源关系数据库,用户基数仅次于Oracle。由于具有更好的性能,目前很多系统都已经用上了最新版本MySQL8。比较遗憾的是Kettle并不支持该版本数据库的连接。无法在同一转
分类:
数据库 时间:
2020-06-28 18:28:07
阅读次数:
158