我文章提到,加载一个文件的部分列是可行。两列,你只读一列,没问题。
但是,两个文件,f1和f2,f1有42列,f2有43列,同时加载到一个流对象,如何?
答:成功加载。但是无结构,discribe后看到:Schema for origin_cleaned_data unknown。这种情况类似merge,合并两个不同列的对象,会生成一个未知模式对象。
背景:因为老日志42列,新日志多...
分类:
其他好文 时间:
2014-10-24 18:55:55
阅读次数:
313
[cloudil@hadoop164 caixianfeng]$ hdfs dfs -mkdir -p /csv-pig/tab1 /csv-pig/tab1tab1.csv:1,true,123.123,2012-10-24 08:55:00 2,false,1243.5,2012-10-25 1...
分类:
其他好文 时间:
2014-10-23 14:23:29
阅读次数:
187
删除ctrl + d 删除光标所在位置上的字符相当于VIM里x或者dlctrl + h 删除光标所在位置前的字符相当于VIM里hx或者dhctrl + k 删除光标后面所有字符相当于VIM里d shift+$ctrl + u 删除光标前面所有字符相当于VIM里d shift+^ctrl + w 删除...
分类:
其他好文 时间:
2014-10-20 15:02:02
阅读次数:
259
一:简单测试job的创建过程案例: 1,先创建一张JOB_TEST表,字段为a 日期格式SQL> create table JOB_TEST(a date);Table createdSQL> commit;Commit complete2,创建一个存储过程 bb 作用是往pig表中插入数据SQL>...
分类:
数据库 时间:
2014-10-17 13:25:19
阅读次数:
193
顺利找到工作之后,大四果然是pig一样的生活。闲来无事说一下本人校招经历吧!九月份之前投了十几个公司,最终参加了阿里,腾讯,美团的笔试,进入阿里和美团的面并收获两家的offer,最终签到了阿里。总结了一下能成功拿到offer的原因,实力是有一些的,当然自己的计划和打算也是相当重要的。怎么说呢?我很早...
分类:
其他好文 时间:
2014-10-16 20:22:43
阅读次数:
187
环境说明:os版本:rhel5.764位hadoop版本:hadoop-0.20.2hbase版本:hbase-0.90.5pig版本:pig-0.9.2访问日志文件,下载文章中的附件!日志放在本地目录路径为:/home/hadoop/access_log.txt日志格式为:220.181.108.151--[31/Jan/2012:00:02:32+0800]"GET/home.php?mod=space..
分类:
数据库 时间:
2014-10-14 21:26:39
阅读次数:
392
这里使用的版本是cdh发行的pig-0.12.0-cdh5.1.2 下载地址点这里
1.Pig简介:
Pig是yahoo捐献给apache的一个项目,它是SQL-like语言,是在MapReduce上构建的一种高级查询语言,把一些运算编译进MapReduce模型的Map和Reduce中,并且用户可以定义自己的功能。这是Yahoo开发的又一个克隆Google的项目:S...
分类:
其他好文 时间:
2014-10-13 21:20:27
阅读次数:
253
PIGS
Time Limit: 1000MS
Memory Limit: 10000K
Total Submissions: 16555
Accepted: 7416
Description
Mirko works on a pig farm that consists of M locked pig-houses and ...
分类:
其他好文 时间:
2014-10-01 15:07:51
阅读次数:
272
Pig 在 Shell中使用,批量加载处理文件...
分类:
其他好文 时间:
2014-09-28 19:16:54
阅读次数:
167
题目链接:POJ 1149 PIGS
PIGS
Time Limit: 1000MS
Memory Limit: 10000K
Total Submissions: 16533
Accepted: 7403
Description
Mirko works on a pig farm that consis...
分类:
其他好文 时间:
2014-09-25 02:42:58
阅读次数:
333