计算机中的编码问题 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节 ...
分类:
其他好文 时间:
2017-07-21 00:04:57
阅读次数:
238
课时1:培训须知第1 章 : Hadoop生态系统以及版本演化 课时2:课程视频 66:53 课时3:学习资料 课时4:第一讲 课后作业第2 章 : HDFS 2.0应用场景、原理、基本架构及使用方法 课时5:课程视频1-HDFS 2.0应用场景、原理、基本架构及使用方法 59:11 课时6:课程视 ...
分类:
其他好文 时间:
2017-07-20 15:16:55
阅读次数:
166
[005]大数据 [005]大数据2017年3月5日3:011. 数据流水线任务智能调度系统实践2. 基于分布式架构的大数据商业建模实践3. 斗鱼实时计算平台的演进4. 打造又快又准的广告分析系统5. 雪球大数据体系实践6. 机器学习在OTA酒店服务的应用7. 海量日志实时分析平台8. 大数据处理和... ...
分类:
其他好文 时间:
2017-07-19 17:51:53
阅读次数:
137
eclipse或STS运行maven工程出现Missing artifact jdk.tools:jdk.tools:jar:1.7问题 最近项目中使用到大数据平台,代码中应用了hbase-client.0.98.6-hadoop2.jar包,该包中引用了jdk.tools.1.7,所以导致ecli ...
分类:
编程语言 时间:
2017-07-19 14:30:23
阅读次数:
509
本文主要阐述大数据平台环境zookeeper常见异常和解决方案 1.Connection reset by peer异常 异常说明 我们现在项目有个任务OneMinuteDataSync是用spark将实时数据同步插入到hbase中,程序已经稳定运行很长一段时间,不过最近数据量增加比较多,任务运行一 ...
分类:
其他好文 时间:
2017-07-12 15:27:47
阅读次数:
389
Hadoop集群环境搭建配置 前言 Hadoop的搭建分为三种形式:单机模式、伪分布模式、完全分布模式,只要掌握了完全分布模式,也就是集群模式的搭建,剩下的两种模式自然而然就会用了,一般前两种模式一般用在开发或测试环境下,Hadoop最大的优势就是分布式集群计算,所以在生产环境下都是搭建的最后一种模 ...
分类:
其他好文 时间:
2017-07-08 20:22:37
阅读次数:
414
2017第九届中国系统架构师大会以“云智未来”为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。 ...
分类:
其他好文 时间:
2017-07-04 20:07:06
阅读次数:
175
1、kafka应用场景 基于流数据的发布订阅消息系统、实时流数据的高效异步通信、基于流数据的高可用分布式存储! 不同的系统之间实时流数据管道; 2、官方一句话概括 kafka是一个分布式流数据平台:可以被用作消息队列,企业级消息系统,具备很强的容错能力;实时处理的能力; 3、kafka的使用 一般都 ...
分类:
其他好文 时间:
2017-07-01 11:58:58
阅读次数:
196
1. 微软中国研发集团服务器与开发工具事业部: http://blogs.msdn.com/stbcblog 作为微软中国研发集团的核心研发部门之一,服务器与开发工具事业部在上海和北京与总部及世界各地产品研发机构紧密配合,致力于为微软用户提供安全与访问、管理与服务、互连系统、数据平台、Windows ...
分类:
其他好文 时间:
2017-06-29 22:34:01
阅读次数:
169
定制化大数据平台一键安装OS大数据平台一键安装OS系列大数据平台一键安装OS【搭建脚本篇】定制化OS镜像制作1.操作环境操作环境:VMwareWorkstarion9andvSphereclient系统:CentOS-6.8-x86_64工具:gconf-editoranacondarepodatacreaterepomkisofsrsync2.主要思路定制化是通过ki..
分类:
其他好文 时间:
2017-06-29 22:31:38
阅读次数:
345