jjzjj

【图算法】(2) 网络的基本静态几何特征(一),附networkx完整代码

立Sir 2024-01-28 原文

大家好,今天和大家分享一下图算法中的静态几何特征,以及如何使用python中的networkx库实现度分布、效率、直径、距离、度-度相关性、介数、核度。内容较多,可通过右侧目录栏跳转。


1. 度分布

1.1 节点的度

以无向网络为例。在网络中,节点  的邻边数  称为该节点的度,是根据网络的邻接矩阵  求得的。计算公式如下:

对网络中所有节点的度求平均,可得到网络的平均度 

无向无权图的邻接矩阵  的二次幂  的对角元素  就是节点  的邻边,即  。实际上,无向无权图的邻接矩阵  的第 i 行或第 i 列的元素之和也是。从而无向无权网络的平均度就是  对角线元素之和除以节点数,即 ,式中  表示矩阵  的迹,即对角线元素之和。


1.2 度分布

大多数实际网络中的节点的度是满足一定的概率分布的。定义  为网络中度为 k 的节点在整个网络中所占的比例

规则网络:由于每个节点具有相同的度,所以其度分布集中在一个单一尖峰上,是一种Delta分布。

完全随机分布:度分布具有泊松分布的形式,每一条边的出现概率是相等的,大多数节点的度是基本相同的,并接近于网络平均度 ,若远离峰值,度分布则按指数形式急剧下降。把这类网络称为均匀网络。

无标度网络:具有幂指数形式的度分布,即  ,所谓无标度是指一个概率分布函数 F(x) 对于任意给定常数 a 存在常数 b 使得 F(ax) 满足 F(x)=bF(x)

幂律分布:是唯一满足无标度条件的概率分布函数。许多实际大规模无标度网络,其幂指数通常为  ,绝大多数节点的度相对很低,也存在少量度值相对很高的节点,把这类网络称为非均匀网络(异质网络)

指数度分布网络:满足  ,式中  一般为常数。


1.3 累计度分布

使用累计度分布函数描述度的分布情况,它与度分布的关系是:  ,它表示度不小于k的节点的概率分布。

度分布为幂律分布,即  ,则相应的累积度分布函数符合幂指数为  的幂分布:

度分布为指数分布,即 ,则相应的累计度分布函数符合同指数的指数分布


1.4 代码实现

1.4.1 泊松分布--ER随机网络

度分布的峰值所对应的横坐标就是网络的平均度

创建ER网络: nx.erdos_renyi_graph( 节点数, 连边概率 )

import networkx as nx
import numpy as np
import matplotlib.pyplot as plt

# 创建一个ER随机网络为例
n = 10000  # 网络节点数
p = 0.001  # 连边的概率0.001
# 生成ER网络
ER = nx.erdos_renyi_graph(n, p)

# 计算获取网络每个节点的度
d = dict(nx.degree(ER))
# 计算平均度=总度数/结点数
d_avg = sum(d.values()) / len(ER.nodes)  # 10.026

# 获取所有的度的值,及其对应的概率
# x记录有哪些度值
x = list(range(max(d.values())+1))
# 获取每个度值出现的次数
d_list = nx.degree_histogram(ER)
# y计算每个度值对应的出现概率=每个度值对应的结点个数/总节点数
y = np.array(d_list) / n

# 绘制度分布
plt.plot(x, y, 'o-')
plt.xlabel('du_num')
plt.ylabel('du_prob')
plt.show()

 度分布曲线如下:


1.4.2 幂律分布--BA无标度网络

BA网络需要在双对数坐标轴下绘制,并且由于0值对应的无穷大没有意义,绘制时需要把0值剔除掉。

创建BA网络:nx.barabasi_albert_graph( 节点数, 平均度/2 )

import networkx as nx
import numpy as np
import matplotlib.pyplot as plt

n = 10000  # 网络节点数
m = 3  # 平均度=6
# 生成网络
BA = nx.barabasi_albert_graph(n, m)

# 获取网络每个节点的度
d = dict(nx.degree(BA))
# 计算平均度=节点度总数/节点总数
d_avg = sum(d.values()) / len(BA.nodes)  # 5.9982

# 获取所有出现的度值
x = list(range(max(d.values())+1))
# 获取每个度出现的次数
d_list = nx.degree_histogram(BA)
# 计算没个度值出现的概率=每个度值对应的结点个数/总结点数
y = np.array(d_list) / len(BA.nodes)

#(1)在普通坐标轴下绘制度分布图
plt.plot(x, y, 'o-', color='b')
plt.xlabel('du_num')
plt.ylabel('du_prob')
plt.show()

#(2)在双对数坐标轴下绘制,由于坐标中存在0出现无穷大的情况
plt.plot(x, y, 'o-', color='r')
plt.xscale('log')
plt.yscale('log')
plt.xlabel('du_num')
plt.ylabel('du_prob')
plt.grid()
plt.show()

#(3)在双对数坐标轴下绘制,并且把点0值坐标排除
new_x = []
new_y = []
# 删除0值
for i in range(len(x)):
    if y[i] != 0:
        new_x.append(x)
        new_y.append(y)

# 绘图
plt.plot(new_x, new_y, 'o-', color='g')
plt.xscale('log')
plt.yscale('log')
plt.xlabel('du_num')
plt.ylabel('du_prob')
plt.grid()
plt.show()

第一张是在普通坐标系下,第二张是双对数坐标系下,第三张是双对数坐标系下删除0值


2. 网络的效率、直径和平均距离

2.1 方法介绍

网络中的两节点  和  之间经历边数最少的一条简单路径(经历的边各不相同),称为测地线

测地线的边数  称为两节点  和  之间的距离两节点之间的最短路径长度

 称为节点  和  之间的效率,记为 ,通常效率用来度量节点之间的信息传递速度。当  和  之间没有路径连通时,,而  。所以效率很适合度量非全连通网络。

网络的直径D定义为所有距离  中的最大值

平均距离(特征路径长度)L定义为所有节点对之间距离的平均值,它描述了网络中节点间的平均分离程度,即网络有多小,计算公式为:

对于无向图来说, 且 ,那么上面的公式可以简化为:

很多实际网络虽然节点数巨大,但平均距离却很小,这称为小世界效应。


2.2 代码实现

网络直径: nx.diameter( Graph )

两个节点之间的效率: nx.efficiency( Graph, 节点1, 节点2 )

两个节点之间的最短路径: nx.shortest_path_length( Graph, 节点1, 节点2 )

网络的局部效率: nx.local_efficiency( Graph )

网络的全局效率: nx.global_efficiency( Graph )

网络的平均距离: nx.average_shortest_path_length( Graph )

import networkx as nx

#(1)直径
# 创建1000各节点,平均度为6的BA网络
G1 = nx.barabasi_albert_graph(1000, 3)
# 计算网络的直径=6
print( nx.diameter(G1) )

#(2)效率
# 计算节点1和5之间的效率=0.5
print( nx.efficiency(G1,1,5) )

#(3)最短路径
# 计算节点1和5之间最短路径长度=2
print( nx.shortest_path_length(G1,1,5) )

# 效率==最路距离长度的倒数

#(4)局部效率
print( nx.local_efficiency(G1) )  # 0.03958432238854824

#(5)全局效率
print( nx.global_efficiency(G1) )  # 0.30804264264331954

#(6)求整个网络的平均距离
# 1k个节点只有3.4的平均距离,距离很小
print( nx.average_shortest_path_length(G1) )  # 3.4374934934934935

4. 度-度相关性

4.1 基于最近邻平均度值的度-度相关性

度-度相关性描述了网络中度大的节点和度小的节点之间的关系。若度大的节点倾向于和度大的节点连接,则网络是度-度正相关的;反之,若度大的节点倾向于和度小的节点连接,则网络是度-度负相关的

节点  的最近邻平均度值把节点 Vi 的邻居的度值加起来求平均,公式如下:

 

式中, 表示节点  的度值, 为邻接矩阵元素。

所有度值为 k 的节点的最近邻平均度值的平均值 ,公式如下:

式中,N 表示节点总数,p(k) 为度分布函数。

如果  是随着 k 上升的增函数,则说明度值大的节点倾向于和度值大的节点连接,网络具有正相关特性,称之为同配网络;反之是单调递减函数,则网络具有负相关特性,称之为异配网络。


4.2 代码实现

import networkx as nx
# 参数是网络
def average_nearest_neighbor_degree(G):
    # 获取所有可能的度
    k = set([G.degree(i) for i in G.nodes()])
    # 从小到大排序所有的度
    sorted_k = sorted(k)
    
    # 求所有度值对应的最近邻平均度
    k_nn_k = []
    for ki in sorted_k:
        c = 0
        k_nn_i = 0
        for i in G.nodes():
            if G.degree(i) == ki:
                k_nn_i += sum([G.degree(j) for j in list(nx.all_neighbors(G,i))]) / ki
                c += 1
        k_nn_k.append(k_nn_i/c)
    
    # 返回所有可能的度,以及度对应的最近邻平均度
    return sorted_k, k_nn_k


5. 介数

5.1 概念介绍

要衡量一个节点的重要程度,其度值当然可以作为一个衡量指标,但又不尽然,例如在社会网络中,有的节点的度虽然很小,但它可能是两个社团的中间联络人,如果去掉该节点,那么就会导致两个社团的联系中断,因此该节点在网络中起到极其重要的作用。对于这样的节点,需要定义另一种衡量指标,这就引出了另一种重要的全局几何量--介数

介数分为节点介数和边介数两种,反映了节点或边在整个网络中的作用和影响力

节点的介数 Bi 定义如下:

式中, 代表节点  和  之间的最短路径条数, 表示节点  和  之间的最短路径经过节点  的条数。

边的介数 Bij 定义如下:

式中, 代表节点  和  之间的最短路径条数, 表示节点  和  之间的最短路径经过边  的条数


5.2 代码实现

计算每个节点的介数: nx.betweenness_centrality( Graph )

计算每条连边的介数: nx.edge_betweenness_centrality( Graph )

import networkx as nx
# 首先创建一个BA无标度网络
BA = nx.barabasi_albert_graph(20, 2)

#(1)计算每个节点的介数
bc = nx.betweenness_centrality(BA)
# 以字典保存,键是节点,值是介数
print(bc)
# 获取介数最大的节点标签
max_id = max(bc, key=bc.get)
print(max_id)  # 3 

#(2)计算每条边的介数
ebc = nx.edge_betweenness_centrality(BA)
# 以字典保存,键是边,值是介数
print(ebc)
# 获取介数最大的连边的标签
max_ebc = max(ebc, key=ebc.get)
print(max_ebc)  #(3,8)

# 绘制网络
nx.draw(BA, node_size=500, with_labels=True)

绘制网络图


6. 核度

6.1 概念介绍

一个图的 k-核 是指反复去掉度值小于 k 的节点及其连线后,所剩余的子图,该子图的节点数就是该核的大小

若一个节点属于 k-核,而不属于 (k+1)-核 ,则此节点的核度为 k

节点核度的最大值叫做网络的核度。

节点的核度可以说明节点在核中的深度核度的最大值自然就对应着网络结构中最中心的位置。k-核 解析可用来描述度分布所不能描述的网络特征,揭示源于系统特殊结构和层次性质。

如下图所示,首先设定一个阈值ks=1,将网络中所有节点的度小于等于1的节点全部删除,直到网络中不存在度小于等于1的节点。有的节点一开始的度是大于1的,但是由于邻接的节点的度是1被删除了,从而导致这个节点的度小于等于1,也要被删除。


6.2 代码实现

计算每个节点的核度: nx.core_number( Graph )

import networkx as nx
# 首先创建一个club网络
kcg = nx.karate_club_graph()

# 计算每个节点的核度
ks = nx.core_number(kcg)
# 以字典类型保存,键是节点,值是节点的核度
print(ks)

# 获取核度最大的节点标签
max_id = max(ks, key=ks.get)
print(max_id)  # 0

# 绘制网络
nx.draw(BA, node_size=500, with_labels=True)

绘制网络图

有关【图算法】(2) 网络的基本静态几何特征(一),附networkx完整代码的更多相关文章

  1. ruby - 如何在 buildr 项目中使用 Ruby 代码? - 2

    如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby​​

  2. ruby-on-rails - Rails 源代码 : initialize hash in a weird way? - 2

    在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has

  3. ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2

    我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征,我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现,但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden

  4. ruby-on-rails - 浏览 Ruby 源代码 - 2

    我的主要目标是能够完全理解我正在使用的库/gem。我尝试在Github上从头到尾阅读源代码,但这真的很难。我认为更有趣、更温和的踏脚石就是在使用时阅读每个库/gem方法的源代码。例如,我想知道RubyonRails中的redirect_to方法是如何工作的:如何查找redirect_to方法的源代码?我知道在pry中我可以执行类似show-methodmethod的操作,但我如何才能对Rails框架中的方法执行此操作?您对我如何更好地理解Gem及其API有什么建议吗?仅仅阅读源代码似乎真的很难,尤其是对于框架。谢谢! 最佳答案 Ru

  5. ruby - 模块嵌套代码风格偏好 - 2

    我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的

  6. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

    几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

  7. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

  8. ruby - Net::HTTP 获取源代码和状态 - 2

    我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur

  9. 程序员如何提高代码能力? - 2

    前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源

  10. 旋转矩阵的几何意义 - 2

    点向量坐标矩阵的几何意义介绍旋转矩阵的几何含义之前,先介绍一下点向量坐标矩阵的几何含义点:在一维空间下就是一个标量,如同一条直线上,以任意某一个位置为0点,以一定的尺度间隔为1,2,3...,相反方向为-1,-2,-3...;如此就形成了一维坐标系,这时候任何一个点都可以用一个数值表示,如点p1=5,即即从原点出发沿着x轴正方向移动5个尺度;点p2=-3,负方向移动3个尺度;     在一维坐标系上过原点做垂直于一维坐标系的直线,则形成了二维坐标系,此时描述一个点需要两个数值来表示点p3=(3,2),即从原点出发沿着x轴正方向移动3个尺度,在此基础上沿着y轴正方向移动两个尺度的位置就是点p3。

随机推荐