最近要为第三方搭建一套大数据平台,中间先进行了虚拟机版本,测试通过后,进行了物理机版本的生产环境,网上关于ambari的文章并不多,但好在ambari官方文档质量略高,社区比较活跃,便整理该系列的文档,将埋掉的坑抛出来,帮助小伙伴们更加快速的搭建自己的hadoop平台。分三..
分类:
其他好文 时间:
2017-04-04 17:54:14
阅读次数:
219
本案例搭建的环境介绍如下:Ambari2.4.2+HDP2.5(hadoop2.7;hive1.2;Tez;Spark2.0)+jdk1.8.25+centos7.0,这里首先要关注些注意事项,至于为什么会一一说明。第一部分:注意事项:版本必须低于7.2selinux必须关闭firewalld必须关闭127.0.0.1hosts该条记录删除本地仓库必须搭..
分类:
其他好文 时间:
2017-04-04 17:53:04
阅读次数:
222
环境准备 三台服务器(由于我是学习环境,所以三台服务器不属于同一内网),配置如下: 公网ip 119.29.186.83 内网ip10.104.157.113 公网ip 119.29.250.47 内网ip 10.104.9.181 公网ip 119.29.251.99 内网ip 10.104.19 ...
分类:
其他好文 时间:
2017-03-30 18:53:16
阅读次数:
111
1、问题描述 单纯的大数据平台无法满足行业用户需要,无法在同类产品中凸显竞争力。 需要抽取业务共性,帮助用户构建满足需要的业务。 发展方向:数据集成+分析展现 2、业务痛点 痛点:对所有文本皆有实时查询需求难点:传统SQL使用WHERE子句匹配LIKE关键词,在庞大的数据字段中搜索某些想要的字,需遍 ...
分类:
其他好文 时间:
2017-03-30 10:55:02
阅读次数:
178
看了好几天redis了,公司从刚开始的redisluster变成了redis主从,原因是rediscluster不可控,其实是我水平没到,万一出点啥事,我这个负责人都解决不了,那就完了!大数据平台下,如果缓存崩了,所有操作提前全都干到数据库,很能造成数据库的崩溃,所以改用简单的主从复制模式,这样即可 ...
分类:
编程语言 时间:
2017-03-27 15:28:14
阅读次数:
479
想了解如何搭建一个好的数据仓库?来听听阿里云高级技术专家-李金波 有何建议?精彩不容错过哦! ...
分类:
其他好文 时间:
2017-03-17 17:33:46
阅读次数:
188
介然(李金波),阿里云高级技术专家,现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历,对系统架构、数据架构拥有丰富的实战经验,曾经数据魔方、淘宝指数的数据架构设计专家。 与阿里云大数据数仓结缘 介然之前在一家软件公司给企业客户做软件开发和数仓开发实施,数仓开发和实施都是基于传统的 ...
分类:
其他好文 时间:
2017-03-16 18:32:49
阅读次数:
222
3月9日14点,业内首个结合技术与应用的在线大数据技术峰会即将展开,届时6位阿里技术大咖与4位行业资深实践者将从技术与业务两个方面,与大家探讨大数据如何最快落地到实践。较为有看点的是: 最深入的实践:本次在线峰会上,6个阿里规模的大数据实践将被深入分享,包括大数据平台的性能调优、流式增量计算、持续发... ...
分类:
其他好文 时间:
2017-03-15 12:29:38
阅读次数:
189
“令人惊喜的是,利用阿里云的数加平台,我们差不多一个多月就搭建好了大数据平台,并且可以通过图形化的界面快速的开发,几个开发人员很快的掌握,甚至我们把阿里云的开发端给了业务部门,他们一些稍微资深一点的业务人员也可以使用,所以我们初步估计了一下,给我们节省的价值至少是千万级的。 ...
分类:
其他好文 时间:
2017-03-15 12:06:43
阅读次数:
288