关于如何用kettle创建job以及如何部署kettle到linux上,我就不细说了,大家应该都会,下面重点说一下,如何让job执行起来先将创建好的脚本上传到kettle指定目录下面,创建调用job执行的脚本文件,exportJAVA_HOME=/usr/java/jre1.6.0_23
exportPATH=$JAVA_HOME/bin:$PATH
expor..
分类:
系统相关 时间:
2014-05-09 21:25:51
阅读次数:
521
通过excel进行快速开发报表:
建设思路:
1.首先制订相关的execl模板。
2.通过etl工具(kettle)可以快速的
将数据库中的数据按excel模板导出成新的excel即可。
其中kettle 按excel模板导出excel 可以参考:
http://type-exit.org/adventures-with-open-source-bi/2010/12/using...
分类:
其他好文 时间:
2014-05-09 01:22:42
阅读次数:
311
版本:cdh5.0.0+hadoop2.3.0+hbase0.96.1.1+Spoon5.0.1一、HBase数据导入HBase数据导入使用org.apache.hadoop.hbase.mapreduce.ImportTsv 的两种方式,一种是直接导入,一种是转换为HFile,然后再次导入。1. HDFS数据为(部分):[root@node33 data]# hadoop fs -ls /inp...
分类:
其他好文 时间:
2014-05-09 00:25:48
阅读次数:
515
加上设置字符编码的方法:response.setHeader("charset","gb2312");********************************************看到的说明原文如下:用AJAX来GET回一个页面时,RESPONSETEXT里面的中文多半会出现乱码,这是因为...
分类:
其他好文 时间:
2014-05-08 21:05:57
阅读次数:
353
通过跟踪Asp.net服务器代码,没有乱码,然而导出Excel到浏览器后,打开时出现乱码。解决方法是添加编码格式的前缀字节码:Response.BinaryWrite(System.Text.Encoding.Unicode.GetPreamble());Response.Clear();Respo...
分类:
Web程序 时间:
2014-05-07 20:29:11
阅读次数:
328
参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707