今天学习了大数据的一些基本的概念。 什么是Hadoop: 大数据主要还是解决海量数据的存储和海量数据的分析计算。 大数据的特点:大量、高效、多样(结构化数据和非结构化数据)、低价值密度。 Hadoop的三大发行版本: Apache、cloundera、hortonworks。 当然现在clounde ...
分类:
其他好文 时间:
2021-07-09 17:52:26
阅读次数:
0
一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgboost4j-flink等。xgboost的基础也是gbm,即梯度提升模型,它在此基础上做了进一步优化 ...
分类:
编程语言 时间:
2021-07-05 19:03:36
阅读次数:
0
IPFS分布式存储全面运用落地之后,FIL币的价值才达到最巅峰。恐怕每个人都明白了一个道理,顺势而为,即做事要顺势,不能逆势而行,这样才更容易成功。现实的法则,生存的法则是这样的。?如今,区块链、数字经济也是如此,抓住“机会”,就能被时代潮流推到成功的彼岸,而这一机遇也是 IPFS作为整个区块链唯一 ...
分类:
其他好文 时间:
2021-07-05 18:21:09
阅读次数:
0
如今大数据行业十分火热,本人认为python是比较强大的分析工具,在网易云课堂上学习了python数据分析。做了案例,写下代码分析过程以及分析结论。 以下是电商打折套路的python数据分析项目。 # -*- coding: utf-8 -*- """ Created on Wed Jan 9 15 ...
分类:
编程语言 时间:
2021-07-02 16:39:07
阅读次数:
0
摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。 本文分享自华为云社区《Make Apache Spark better with CarbonData》,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎 ...
分类:
Web程序 时间:
2021-06-30 18:44:44
阅读次数:
0
摘自微信公众号:学习曾国藩一个人在没有人监督的情况下,自发自愿保持个人高尚的道德品质,在能做各种坏事的情况下,不做坏事,这就是——慎独。多年前,我听过一个故事,说在哈佛大学附近有一个便利店,便利店没有收银,店里放一个盒子,盒子里都是零钱,自己拿东西,自己付钱,自己找钱,没有人监督,盒子上面写了一句话 ...
分类:
其他好文 时间:
2021-06-30 18:05:28
阅读次数:
0
第二章.HDFS 1.大数据的两个核心技术 2.HDFS设计目标 3.HDFS自身的局限性 4.HDFS采用块设计以及采用块设计的好处 5.HDFS组成架构 6.元数据信息被持久化到磁盘分为哪两个文件 7.第二名称节点的作用 8.名称节点,数据节点的功能 待补充 9.副本机制、数据容错机制、心跳机制 ...
分类:
其他好文 时间:
2021-06-28 20:29:20
阅读次数:
0
特斯拉汽车违反了那些行业道德 特斯拉的事情沸沸扬扬,就把这个当做一个案例,来理解行业道德。 特斯拉是指特斯拉汽车。 ...
分类:
其他好文 时间:
2021-06-28 20:15:28
阅读次数:
0
一、大数据的基本特征(4V,存储单位) 二、大数据对思维方式的影响 三、Google 三辆马车是什么? Google的文件系统GFS(Google File System)、分布式计算框架MapReduce、Bigtable 四、Hadoop 是什么,基本特征 基本特征: 五、Hadoop 生态系统 ...
分类:
其他好文 时间:
2021-06-28 18:27:13
阅读次数:
0
自动化运维平台架构图 微服务部署和监控运维框架图 云原生下的DevOps自动化运维 多环境#交易系统#DevOps架构 基于大数据智能化的自助终端远程运维服务架构 自动化运维全流程 ...
分类:
其他好文 时间:
2021-06-28 18:10:44
阅读次数:
0