大数据服务通常要经过数据ETL、数据存储、数据分析、数据展示、数据开放的过程,因此在计算能力、存储能力以及网络能力的估算上也有自身的特点。
分类:
其他好文 时间:
2020-02-21 17:58:38
阅读次数:
66
大数据服务的数据源不但来自归属于不同行业的组织之中,而且其类型还具有多样性(Variety)特征。多样性指的是大数据服务不仅包括例如姓名、年龄这样的结构化数据,还包括歌曲、电影这样的非结构化数据,此外网页、邮件这样的数据介于结构化和非结构化之间,属于半结构化数据,也是大数据服务的重要数据源。结构化数据来源于业务需求,系统分析员将需求中静态的“名词”提取出来并进行抽象,作为数据库表结构设计的依据。比
分类:
其他好文 时间:
2019-11-09 00:39:55
阅读次数:
119
数据采集过程包括集成、导入、格式化。数据采集过程中首先集成来自不同来源的数据。数据集成要考虑存储架构、采集方式、接口方式、采集周期等。在存储架构方面,可以考虑在数据源侧设置数据暂存区(StagingArea),也可以考虑在采集平台侧设置的暂存区。靠根据数据量和累计速度来设置合理大小的数据暂存区,防止数据溢出。在存取方式方面,可以根据应用的需要采用不同的存取方式。采集方式包括单个采集和批量采集两种类
分类:
其他好文 时间:
2019-11-09 00:31:54
阅读次数:
83
数据治理包括:隐私、安全、合规性3个方面。大数据价值创造的前提和基础是企业自身的数据以及全社会开放的数据,当数据开放为社会带来好处的同时,也同时因此了隐私侵犯问题。隐私是社会赋予个人或者企业的权利,隐私权受到法律的保护,因此,企业在利用大数据的同时,要首先考虑大数据应用是否会侵犯他人或者组织的隐私。企业可以多种方式来解决隐私触犯问题。对于企业向内部人员提供的大数据服务,可以通过数据权限保证隐私数据
分类:
其他好文 时间:
2019-11-09 00:31:24
阅读次数:
122
数据管理过程主要包括:数据转换、数据关联、数据丰富、数据操作以及数据保持。数据转换就是将数据从一种形式变换为另一种形式,通过形式的变化,使得数据更便于分析利用。比如在数据采集阶段导入的原始数据,需要将其从字符串类型转换为浮点型,这样便于对该数据项进行求和。另外,也可能因为数据格式问题进行数据转换,比如原始数据为网页这样的半结构化数据,为了能够搜索到网页中的数据,往往需要将网页中的关键数据提取出来并
分类:
其他好文 时间:
2019-11-09 00:11:35
阅读次数:
92
数据采集过程包括集成、导入、格式化。数据采集过程中首先集成来自不同来源的数据。数据集成要考虑存储架构、采集方式、接口方式、采集周期等。在存储架构方面,可以考虑在数据源侧设置数据暂存区(StagingArea),也可以考虑在采集平台侧设置的暂存区。靠根据数据量和累计速度来设置合理大小的数据暂存区,防止数据溢出。在存取方式方面,可以根据应用的需要采用不同的存取方式。采集方式包括单个采集和批量采集两种类
分类:
其他好文 时间:
2019-11-09 00:04:23
阅读次数:
173
大数据正在爆炸式增长,每天都有来自世界各地的公司涌现出新的项目。好消息是,所有技术都是开源的,可供您今天开始采用。Hadoop稳固,企业实力和其他一切的基础。您需要YARN和HDFS以及Hadoop的基础架构作为主要数据存储并运行关键的大数据服务器和应用程序Spark易于使用,支持所有重要的大数据语言(Scala,Python,Java,R),一个庞大的生态系统,快速增长,易于微缩/批处理/SQL
分类:
其他好文 时间:
2019-06-14 19:55:58
阅读次数:
109
干货 | 快速实现数据导入及简单DCS的实现 原创:?赵琦?京东云开发者社区 4月18日 对于多数用户而言,在利用云计算的大数据服务时首先要面临的一个问题就是如何将已有存量数据快捷的导入到大数据仓库中。本文将演示如何基于京东云数据计算服务平台,简单、快速地将数据导入数据计算服务。 我们通常说的大数据 ...
分类:
其他好文 时间:
2019-05-28 12:51:30
阅读次数:
127
搜索服务是阿里云产品非常重要的组成部分,也承载了阿里巴巴集团的全部主要的搜索任务。这里的搜索服务主要包含两个产品:阿里云Elasticsearch和开放搜索OpenSearch。本文将介绍如何玩转阿里云搜索的大数据服务。
分类:
其他好文 时间:
2019-01-09 11:20:54
阅读次数:
202
◆工业大数据、农业大数据、大数据应用等;
◆大数据智能制造与信息基础设施、大数据软件及服务等;
◆大数据+电子商务、大数据+医疗大健康、大数据+金融科技、大数据+影视文化等;
◆互联网创新应用、云技术区、云应用区等;
◆大数据地理工程信息、大数据服务、大数据运输交通综合信息管理、大数据电子等;
◆大数据智能家庭、大数据安全服务等;
◆数据中心:
◆模块化数据中心、数据云箱、机房解决方案、数据中心基础设施、蓄电池、电能存储方案、机房专用精密空调、UPS不间断电源、绿色数据中心等最新成果。
◆数据中心基础类设施:集中监控、综合布线、机柜、发电机组及负载、防雷产品、消防设备、蓄电池、加湿除湿产品、新风机、配冷送风系统、精密配电柜及电能质量产品、PDU、KVM、电源、门禁、防静电地板、测试仪、大屏幕等。
◆数据中心IT产品:服务器、路由器、交换机、存储/闪存、数据管理、数据保护、数据备份、网络安全、防火墙、数据库、光端机等。
◆机房网络存储产品:SCSI及SAS卡、磁带机、NAS网络存储器、磁带库、RAID卡、磁盘阵列、SCSI及SAS硬盘、光盘镜像服务器、SCSI及SAS
分类:
其他好文 时间:
2018-11-24 11:51:40
阅读次数:
280