码迷,mamicode.com
首页 >  
搜索关键字:mahout hadoop canopy 聚类 大数据    ( 26726个结果
小企业面对大数据如何破局,高并发与海量数据技术又如何操作?
公司的项目数据量有限,获取行业线上线下消费数据也困难,没有足够的数据量,如何应用大数据?如何在公司现有情况下接触实际的高并发大数据项目? 就是想实操一下高并发的架构设计或者参与互联网级别项目的开发,但又不想舍弃现在的工作? 中小企业如何想办法破局 大数据本身就特别容易形成技术垄断,让长尾的中小企业无 ...
分类:其他好文   时间:2021-05-24 09:54:03    阅读次数:0
(转)Spark与Map-Reduce区别对比
典型架构 很多的场景都是如上的,有web(包括无线、以前CS的模式、现在的BS模式等)、DB、cache、数据分析我就用了Hadoop了(代名词,或者泛指数据仓库了),另外就是一些传感器之类的,数据通道(有的简单如:jdbc等,有的比较复杂,保序不丢等),其中也简单列了一些中间件的软件。这张图组成了 ...
分类:其他好文   时间:2021-05-24 09:02:34    阅读次数:0
从RDD创建DataFrame
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() import pandas as pd import numpy as np arr = np.arange(6).reshape(-1 ...
分类:其他好文   时间:2021-05-24 08:54:40    阅读次数:0
常见未授权访问测试脚本
扫描以下常见未授权访问 redis、mongodb、memcached、elasticsearch、zookeeper、ftp、CouchDB、docker、Hadoop 安装 pip3 install -r requirements.txt -i https://mirrors.aliyun.co ...
分类:其他好文   时间:2021-05-24 08:32:18    阅读次数:0
团队冲刺阶段的要求2
项目预计第一阶段花费十天的时间,第二阶段粗略估计要花一个月,因为第二阶段所需要的技术,像 Hadoop,kafka之类的之前并没有接触过,而第一阶段的工作,css、JavaScript、HTML,echarts等 在之前的学习中已有涉猎。目前已经花费十天,还剩余一个月 产品状态:目前已实现获取当前热 ...
分类:其他好文   时间:2021-05-24 07:14:48    阅读次数:0
hadoop 启动dfs失败(but there is no HDFS_NAMENODE_USER defined)
https://blog.csdn.net/linuxvfast/article/details/93720931 在Hadoop安装目录下找到sbin文件夹 在里面修改四个文件 对于start-dfs.sh和stop-dfs.sh文件,添加下列参数: #!/usr/bin/env bash HDF ...
分类:其他好文   时间:2021-05-24 06:40:05    阅读次数:0
杭州蚂蚁中台技术部-22届应届生-校招实习
1:业务背景介绍 本次为22届的实习生校招,请不符合要求的同学不要投简历过来。 本岗位为技术开发和大数据研发岗位,想做产品和运营的同学请移步其他地方投简历谢谢 业务相关的背景请参照: https://job.alibaba.com/zhaopin/position_detail.htm?spm=a2 ...
分类:其他好文   时间:2021-05-24 05:53:07    阅读次数:0
centos7安装配置Hadoop集群
2、安装3台虚拟机并实现SSH免密登录 (1)安装三台虚拟机centos7 第一台正常安装,后两台做克隆。配置好IP地址,关闭防火墙跟SELINUX。 106.14.69.185 server1 121.5.218.141 server2 (2)修改用户名以及对应的IP # vi /etc/host ...
分类:其他好文   时间:2021-05-24 05:35:32    阅读次数:0
Spark SQL 及其 DataFrame 的基本操作
Spark SQL 及其 DataFrame 的基本操作 Q & A 1. Spark SQL 出现的原因是什么? 关系数据库已经流行多年,能较好的满足各类商业公司的业务数据管理需求,但关系数据库在大数据时代已经不能满足各种新增的用户需求。用户需要从不同数据源执行各种操作(包括结构化和非结构化数据) ...
分类:数据库   时间:2021-05-24 04:48:45    阅读次数:0
完美避坑!记一次Elasticsearch集群迁移架构实战
前言 Elastic自身设计了集群分片的负载平衡机制,当有新数据节点加入集群或者离开集群,集群会自动平衡分片的负载分布。 需求背景 公司原有大数据平台基于公有云构建,由于种种原因,现在需要迁移到自建机房,Elasticsearch集群承担了大数据平台主要的对外查询需求,也有部分实时计算需求基于Ela ...
分类:其他好文   时间:2021-05-24 03:46:38    阅读次数:0
26726条   上一页 1 ... 7 8 9 10 11 ... 2673 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!