标签:idt 它的 ted 基本 阶段 时间 随机 扩展 限制
第二章第六节 P2P应用
在本节内容开始前,我们要先来对P2P架构有一个宏观的认知:
P2P:(Peer to Peer 对等结构) 以对等方式进行通信,并不区分客户端和服务端,而是平等关系进行通信。在对等方式下,可以把每个相连的主机当成既是主机又是客户,可以互相下载对方的共享文件。比如迅雷下载就是典型的P2P通信方式。
本章描绘的前三个应用都采用了CS(客户-服务器)体系结构,极大的依赖于总是打开的基础设施服务器。而在本节中,我们将介绍两种适用于P2P的应用:一个是文件分发,在其中我们将介绍流行的BitTorrent协议;另一个是分布在大型对等方社区中的数据库,在其中我们将探讨分布式散列表(Distrubuted Hash Table,DHT)的概念。
Outline
Note
- 纯P2P架构具有如下特点:
- 没有服务器,任意端系统之间直接通信
- 节点阶段性接入Internet
- 节点可能更换IP地址
- 资源共享
- 资源分布
## 文件分发
【P2P体系结构的扩展性】
- 为了方便讨论,我们假设如上图的简单定量模型,其中us为服务器上传带宽;ui为节点i上传带宽,di为节点i下载带宽。
- 对于客户机/服务器架构:
- 服务器串行地发送 N 个副本,时间为: NF/us
- 客户机i 需要 F/di 的时间下载
- 我们所需要的最短时间为:
- 对于P2P架构:
- 服务器必须发送一个副本,时间: F/us
- 客户机i 需要 F/di 的时间下载
- 总共需要下载NF比特
- 最快的可能上传速率: us + ∑ui
- 所需要的最短时间为:
- 结论:对足够大的N(对等方的数量):
- 客户机/服务器体系结构的分发时间随着对等方的数量N线性增加并且没有界。
- P2P体系结构,其最小分发时间曲线与log2N曲线类似,因此最小分发时间远小于客户机/服务器体系结构的分发时间。其自扩展性很强。
【BitTorrent】
- BitTorrent是一种用于文件分发的流行P2P协议,每个下载者在下载的同时不断向其他下载者上传已下载的数据。
- BT协议与FTP协议不同,特点是下载的人越多,下载速度越快,原因在于每个下载者将已下载的数据提供给其他下载者下载,充分利用了用户的上载带宽。通过一定的策略保证上传速度越快,下载速度也越快。
- 基本概念:
- Torrent:参与一个特定文件分发的所有对等方的集合被称为一个洪流。
- chunk:在一个洪流中的对等方彼此下载等长度的文件块(一个文件被分成若干个块),典型的块长度为256KB。
- Tracker:每个洪流都有一个基础设施结点,成为追踪器
- 当一个新节点(Alice)加入torrent:
- 没有chunk,但会随着时间不断积累
- 结点向tracker注册获得节点信息表,并与某些结点建立联系(成为“邻居”),一个结点的临近对等点会随着时间而波动。
- 结点下载的同时,也为其他对等方上传了多个块。结点可能随时加入或离开。
- chunk的获取
- 给定任一时刻,不同的节点持有文件的不同chunk集合
- 节点(Alice)定期查询每个邻居所持有的chunk列表
- 节点发送请求,请求获取缺失的chunk
- 稀缺优先:针对她没有的块在他的邻居中决定最稀缺(副本数量最少)的块,并优先请求稀缺块
- 稀缺优先的目的:大致的均衡每个块在洪流中的副本数量
- chunk的发送:决定Alice响应哪个请求(对换算法)
- Alice根据当前能够以最高速率向他提供数据的邻居,给出其优先权
- 每10秒,重新评定一下Top4,这四个对等方被称为疏通(unchocked)
- 每30秒,Alice随机选择一个其他结点,向其发送chunk。
- 除了随机选择的伴侣作为试探对等方和之前的Top4,其他的对等方都称为阻塞()
## P2P应用:索引技术
【P2P中搜索信息】
- P2P系统的索引:信息到节点位置(IP地址+端口号)的映射。
- 文件共享(电驴)
- 利用索引动态跟踪节点所共享的文件的位置
- 节点需要告诉索引它拥有哪些文件
- 节点搜索索引,从而获知能够得到哪些文件
- 即时消息(QQ)
- 索引负责将用户名映射到位置
- 当用户开启IM应用时,需要通知索引它的位置
- 节点检索索引,确定用户的IP地址
【集中式索引】
- 如上图所示,集中式索引更像是P2P和CS的混合体
- 当Alice需要下载信息时,经过以下步骤:
- 初始时,所有的对等方要将自身的IP和可共享的文件名称通知集中式索引服务器,该索引服务器从每个活动的对等方那里收集这些信息,从而建立起一个动态索引,将每个文件拷贝映射到一个IP地址集合。
- 当Alice需要下载一些文件时会将查询内容发送给索引服务器,服务器将查询结果返回给Alice(Bob的IP地址)。
- Alice根据收到的信息,从Bob处下载资源。
- 集中式索引的问题:内容和文件传输是分布式的,但是内容定位是高度集中式的。会出现如下问题:单点失效问题、性能瓶颈、版权问题。
【查询洪泛】(建立在“Gnutella”协议基础上)
- 查询洪泛采用完全分布式方法。在查询洪泛中,索引全面地分布在对等方的区域中。每个对等方索引可供共享的文件而不索引其他文件。
- 其扩展性差,尤其是为了防止某个对等方发起查询,该查询就会传播到整个覆盖网络的每个其他对等方,从而产生大量流量。为解决这个问题,设计者使用了受限查询洪泛,即限制其传播的最大跳数。
【层次覆盖】(由FastTrack首创,Kazza和Morpheus也实现了这种文件共享协议)
该方法结合了上述两种方法的优秀特征,与洪泛查询类似,层次覆盖设计不使用专用的服务器(或服务器场)来跟踪和索引文件。然而,与洪泛查询不同的是,在层次覆盖的设计中并非所有对等方都是平等的。
如下图所示,如果某对等方不是超级对等方,则它就是一个普通对等方,并被指派为一个超级对等方的子对等方。
超级对等方维持着一个索引,该索引包括子对等方正在共享的所有文件的标识符、有关文件的元数据和相应子对等方的IP地址,但与前面的集中式索引不同,这里的超级对等方并不是一台专用服务器,而是普通对等方。超级对等方之间可以相互建立TCP连接,从而形成一个覆盖网络。
## 分布式散列表
在课程中未涉猎,具体请移步https://blog.csdn.net/zy_zhengyang/article/details/76838523
【计算机网络】2.6 P2P应用
标签:idt 它的 ted 基本 阶段 时间 随机 扩展 限制
原文地址:https://www.cnblogs.com/hithongming/p/9350978.html