1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 Pandas Spark 工作方式 单机single machine tool, ...
分类:
其他好文 时间:
2021-05-24 09:31:44
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 Pandas Spark 工作方式 单机single machine tool, ...
分类:
其他好文 时间:
2021-05-24 09:29:07
阅读次数:
0
典型架构 很多的场景都是如上的,有web(包括无线、以前CS的模式、现在的BS模式等)、DB、cache、数据分析我就用了Hadoop了(代名词,或者泛指数据仓库了),另外就是一些传感器之类的,数据通道(有的简单如:jdbc等,有的比较复杂,保序不丢等),其中也简单列了一些中间件的软件。这张图组成了 ...
分类:
其他好文 时间:
2021-05-24 09:02:34
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() import pandas as pd import numpy as np arr = np.arange(6).reshape(-1 ...
分类:
其他好文 时间:
2021-05-24 08:54:40
阅读次数:
0
扫描以下常见未授权访问 redis、mongodb、memcached、elasticsearch、zookeeper、ftp、CouchDB、docker、Hadoop 安装 pip3 install -r requirements.txt -i https://mirrors.aliyun.co ...
分类:
其他好文 时间:
2021-05-24 08:32:18
阅读次数:
0
官方文档:https://redis.io/commands/info info主要有一下几项,因版本不同可能略有差别 server clients memory persistence stats replication cpu keyspace 172.21.194.205:6381> info ...
分类:
其他好文 时间:
2021-05-24 07:56:28
阅读次数:
0
项目预计第一阶段花费十天的时间,第二阶段粗略估计要花一个月,因为第二阶段所需要的技术,像 Hadoop,kafka之类的之前并没有接触过,而第一阶段的工作,css、JavaScript、HTML,echarts等 在之前的学习中已有涉猎。目前已经花费十天,还剩余一个月 产品状态:目前已实现获取当前热 ...
分类:
其他好文 时间:
2021-05-24 07:14:48
阅读次数:
0
https://blog.csdn.net/linuxvfast/article/details/93720931 在Hadoop安装目录下找到sbin文件夹 在里面修改四个文件 对于start-dfs.sh和stop-dfs.sh文件,添加下列参数: #!/usr/bin/env bash HDF ...
分类:
其他好文 时间:
2021-05-24 06:40:05
阅读次数:
0
2、安装3台虚拟机并实现SSH免密登录 (1)安装三台虚拟机centos7 第一台正常安装,后两台做克隆。配置好IP地址,关闭防火墙跟SELINUX。 106.14.69.185 server1 121.5.218.141 server2 (2)修改用户名以及对应的IP # vi /etc/host ...
分类:
其他好文 时间:
2021-05-24 05:35:32
阅读次数:
0
本文从高可用的角度观察一下 RabbitMQ、Kafka、RocketMQ,看看它们各自的实现思路。 1. RabbitMQ RabbitMQ 有 3 种部署模式: 单机模式 普通集群模式 镜像集群模式 单机模式与高可用完全没关系,咱就不说了,直接看看这2种集群模式。 1.1 普通集群模式 某一个 ...
分类:
其他好文 时间:
2021-05-24 04:17:36
阅读次数:
0