标签:
零、概念、定义与符号
一、大规模网络的属性
1.无尺度分布(scale-free distribution)
也叫幂律分布(power law distribution)。大规模网络中,大部分结点度数不大,而少数结点则拥有很大的度数。在重对数尺度下(log-log scale)大规模网络都展现了相似的模式:一条直线或者近似直线。这个模式称为幂律分布或者无尺度分布,这种自相似性与尺度无关。结点的度具有幂律分布的网络称为无尺度网络。
Friendship Network in YouTube:
图1. Long tail distribution, scale-free distribution 图 2. Straight line if plot in a log-log scale
2.小世界效应(the small-world effect)
网络中最长的最短路径就是它的直径(diameter),从现实的大规模网络中,都可以观察到一个小的路径。如著名的六度分隔理论。
3.强的社区结构(strong community structure)
人们更倾向于与一个圈子的人联系,而圈子外的人的联系往往相对较少。朋友的朋友很容易成为朋友,这个传递性可以通过聚类系数(clustering coefficient)来度量,也就有了朋友之间的联系(connection)数量与所有联系数量的比例。假设结点vi 有di个邻居,这些邻居中有ki条边,那么聚类系数Ci就是:
聚类系数(clustering coefficient)度量了一个人朋友之间的联系密度。拥有社区的网络比一个随机网络更有可能具有较高的平均聚类系数。
图3.包含9个用户和14个联系的社会网络.直径为5.
各点的聚类系数C1= 2/3、C2=1、C3=2/3、C4=1/3、C5=2/3、C6=2/3、C7=1/2、C8=1、C9=0平均聚类系数C = (C1 + C2 + … + C9)/9 = 0.61;而包含9个用户和14个联系的随机网络的聚类系数期望值是14/(9*8/2) = 0.19.
二、社会媒体挖掘的新挑战
三、社会计算的任务
? 中心性分析与影响建模 社会计算(贰)
? 社区发现 社会计算(叁)
? 分类与推荐 社会计算(肆)
? 隐私、垃圾信息与安全 社会计算(伍)
标签:
原文地址:http://www.cnblogs.com/LittleTreasureBox/p/5151786.html