码迷,mamicode.com
首页 > 其他好文 > 详细

云计算:大数据时代的系统工程

时间:2015-09-09 19:49:19      阅读:174      评论:0      收藏:0      [点我收藏+]

标签:云计算平台   流程管理   系统工程   互联网   数据中心   

1.算哲组织资源以服组织实现组织流程以应变):服和平台

(1)是指在互联网以服形式提供用,也是指在据中心提供些服

云:据中心的硬件和

(2)前身:超大模分布式

(3)核心思想:通用、动态:多租

:控制损耗(群组通信:单点失效、冗余机制、多活体机制、消息顺序机制)

状态感知(成员管理服务、全局视图)

动态平衡(由节点增加而对负载进行的动态均衡、DHT算法)

透明:冗余等方式保证系统底层架构节点问题,不会对整体影响

        用户无需关心底层实现方式,只要专注上层的业务逻辑

        自容错(会话复制技术、节点内存连接到全局共享内存数据空间)

        自管理(分布式的执行机制、基于策略的自动化管理、事件驱动机制)

        跨平台互操作性(用户通用、应用通用、平台层通用)

木化:业务流程管理BPM、资源快速重组满足不同业务需要

 (4)模式:模式(云服)、技(按需提供强大源的云算平台)。

 (5)大用、大据、大系

 (6)局限:带宽、安全、原子操作(最小不可分割)时延问题

2. 20068SES搜索引擎略谷歌CEO施密特算命名

2006亚马逊EC2动态计算云)服明确云算商模式

3.云商模式:

1SaaS件即服务(互联网提供软件服务):按需求提供服务、无需购买软件、会员费、不对底层云基础设施进行管理控制

2PaaS平台即服务(互联网提供应用程序运行平台服务):以服务形式交付计算平台和解决方案包,提供创建、应用测试及应用部署的高度集成环境,无需购买软硬件

      (1)不会对底层基础设施管理控制:网络、服务器、操作系统、存储等

      (2)可控制所部署的应用,服务商提供应用服务编程接口

      (3)eg:谷歌GAE开发托管网络应用平台

3IaaS础实施即服务:互联网提供基础设施服务

  (1)消费者获得处理能力、存储、网络和其他基础计算资源

  (2)可部署运行操作系统和应用等任意软件

  (3)网站托管、数据存储备份、电子商务、高性能计算、搜索引擎、虚拟主机服务等

      (4)eg:亚马逊AWS(存储、计算、消息传递(SQS)和数据采集(SimpleDB)等服务)

4. SaaS面向服务对象与普通单机应用程序的客户无明显区别

  PaaS用户对象是开发人员,需了解平台提供环境下应用的开发和部署

  IaaS最底层的IT基础设施服务,面向IT管理人员

5.部署使用方式

1)公有云Public Cloud使用的云基础设

2)私有云Private Cloud:客户单独使用而建立的云基础设施,提供对数据、安全性和务质量最有效控制,可控制在此基础设施上部署用程序的方式

.【公有云和私有云区别】主要体在商业应用方面,技上互通,但技术层面根本区别访问权限和访问模式的控制(可访问围决定了云的业务

3)混合云Hybrid Cloud:半公半私,源借用/租用

6.算技流派

Yahu :搜索起家,门户网站模式

展大模分布式系最多的是通用性(支持各种应用、非存问题

未解决邮箱存和搜索效率问题Hadoop

Google:搜索起家,保块数据的查询和搜索的效率和可用性

储为根,本、高效新可用性

Amazon子商,底核心作用保线交易不中

品台Dynamo更适用存对较小的

7.Hadoop大量行分布式理的件框架,主要由HDFS(文件系)、MapReduce算机系)、Hbase)等成。

Yahu,技思想Google

8. GFSHDFS:一主控服器(Master+子表服器(Chunk Server

9. Dynamo:采用哈希算法切分据,将数据在一诶单,分担

10.VMware:主要向企提供虚拟化技定其技是自虚拟化做起,向上、更高面上的虚拟化技术来部署云算平台

  特点:借虚拟化技术实现的各硬件源的池化,在此基上配置、度和管理

11.分布式系:通过网络将物理上分散的接起决问题

12.来说.据量含量、流量(并发

13.cebook将数据存储在Hadoop分布式文件系统(HDFS)上,依靠Hive完成数据分析

14.系统由许多廉价的普通组件组成,组件失效是常态。系统必须时刻监控自身状态,迅速地侦查、承受并恢复失效组件

15.云计算快速发展的因素

   1技术:光纤使用、宽带普及、结点通信、虚拟化技术、AjaxLAMP

2商业模式&需求:软件即服务

16.AjaxAsynchronous JavaScript XML 异步的JavaScriptXML技术

   服务器对客户端的表单反馈,不会因为部分更改而刷新所有页面内容消失再出现的刷新,仅需返回更改必需的数据

17.XaaS一切皆可为服务。衍生商业流程即服务、数据库即服务、安全即服务等

     服务随时可接入、服务应永远在线、服务拥有足够大的用户群

18.并行计算:同时执行多个指令的计算模式,化大为小加快计算速度。紧耦合

    耦合:互相交互的系统彼此间的依赖

分布式计算:松耦合,将分布于各处的计算资源以透明、可扩展方式连接共同解决问题

【比较】(1)分布式计算的资源分散,通过网络节点连接表现出无共享的架构

           各处处理器都有自己的存储器,通过处理器之间的消息传递进行信息交换

        (2)并行计算通常集中于一处,通过共享存储来进行信息交换

          所有的处理器共享一个存储器,一次交换处理间信息

(3)NUMA(非一致存储访问结构)MPP(大规模并行处理)每个节点都有自己的CPU、内存和I/O,节点通过某些机制信息交互

19.集群(Cluster):用多个计算机,冗余互联组成一个对用户来说单一的高可用性的系统

20.网络计算技术:将分散在网络中的计算机节点(如空闲服务器、存储系统等)连接在一起,形成一个拥有超强性能的虚拟计算机,为用户提供强大的计算存储能力

    松耦合、异构性质更明显

21.网格计算:多个零散资源为个别任务提供运行环境

   云计算:单个整合资源为多个用户提供服务

22..SOA(Service Oriented Architecture)面向服务的体系结构,组织和利用可能处于不同所有权范围控制下的分散功能的范式

        给定一种彼岸准接口和一个约束借口的服务协议,则任何业务应用只要满足即可通过给定标准接口进行通信和交互,实现对接。

本质:用于交换系统和系统之间的信息的企业集成技术

23.EAI(EnterpriseApplication Intergration)企业应用集成技术:基于消息中间件产品

24.虚拟化(Virtulization):资源的逻辑表示,不收物理限制的约束

     将底层资源抽象,向上提供与真实的层相同或类似功能,屏蔽设备的差异性和兼容性

25.云计算进行负载均衡方法:横向切分(按工作量切分)、竖向切分(按工作流程切分)

26.业务应用架构:展现层、业务层、数据层

27.分布式数据总线:运维管理系统,数据采集系统、数据存储系统、数据服务系统、服务交付系统,分布式调度系统/分布式工作流引擎

(1)分布式调度系统/分布式工作流引擎:系统执行者,实现定义、调度、协作和执行,主要支撑大规模系统的自动化运维和分布式计算框架的实现

(2)运维管理系统:配置控制。权限管理、监控报警、应用管理、故障管理,集成策略引擎、分布式工作流、资源与服务管理调度等机制

(3)数据采集系统(数据驱动架构起点):配置管理、数据过滤、数据预处理

(4)数据存储系统(任何信息系统核心):统一存储系统

    关系型数据库集群:海量强关系结构化数据的存储和快速访问

    分布式实时数据库:用户行为数据和系统日志数据等数据量特大、关联性不强

    分布式文件系统:总数据量和总容量都大的各类图片、视频等媒体文件

非结构化数据实时高效存储和访问

(5)数据分析系统:分布式计算模型(数据转换、数据聚合、数据关联、数据挖掘)

(6)数据服务系统:连接企业信息系统支撑平台与上层业务应用的桥梁

    服务管理系统:服务注册、注销、变更、审核、发布、设计

    数据访问服务---数据缓存:数据库访问、实时访问、文件系统访问

    业务逻辑服务---数据缓存:推存系统、智能分析、统计报表

(7)服务交付框架:前端服务器、交付服务器、负载均衡

 


本文出自 “Linux运维” 博客,请务必保留此出处http://xuding.blog.51cto.com/4890434/1693124

云计算:大数据时代的系统工程

标签:云计算平台   流程管理   系统工程   互联网   数据中心   

原文地址:http://xuding.blog.51cto.com/4890434/1693124

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!