最小生成树and最短路径

最小生成树and 最短路径

无独有偶,在两个学期的期末中两门不同的科目《离散数学》和《数据结构》中都谈到了图及其衍生的最小生成树、最短路径问题,并给出了相应的算法——克鲁斯卡尔、普林、迪杰斯特拉、沃舍尔算法。这无疑是释放了一个很大的信号——这些内容很重要。由于之前学《离散数学》时只要求在思想上理解,并没要求程序实现,所以学起来也挺吃力的。而现在来到了《数据结构》的课程上,我觉得还是有必要写写理解与体会,好让以后用起来没那么难。

最小生成树(Minimum Spanning Tree,MST )

一个有 n 个结点的连通图的生成树是原图的极小连通子图,且包含原图中的所有 n 个结点,并且有保持图连通的最少的边。即是在原图上删除边,直到剩余n-1条边,保证n 个结点连通且边的权值加起来最小。

简单图示:

克鲁斯卡尔(Kruskal )算法

克鲁斯卡尔算法从边的角度来解决问题,即在剩下的所有未选取的边中,找最小边,如果和已选取的边构成回路,则放弃,选取次小边。然而,图的存贮结构采用边集数组,且权值相等的边在数组中排列次序可以是任意的,该方法对于边数相对比较多的图不是很实用,浪费时间。可以说克鲁斯卡尔算法是很直观的算法,适合人的直观思考方式,但是因为上面论述的缘故,克鲁斯卡尔算法比较适用在稀疏图(边的数目不是很多的图)上。

边集数组:

从图变为程序需要的数据,需要采用合适的数据结构。由算法的核心思想上看,我们需要存储的数据为边,而边的要素包括三点:连接的两个结点、边的权值。然而边并不需要具有什么操作来改变自身或者做些什么,所以用struct 来自定义就合适不过了。

struct edge{ int node_1; int node_2; int value ; };

另外,文中提及了最小边、次小边,这就暗示了应该对所有的边进行排序(sort )。 比较函数应以value 作衡量。

bool cmp(edge a , edge b) {

return a.value

现在剩余最后的问题——回路的避免。其实这个也很容易避免,我们可以定义一个数组used[max],它记录了每一个结点是否被应用的情况,当要加入的一条边中used[a.node_1]和 used[a.node_2]都已被应用,那么加入的这条边必然造成回路,否则不会。若造成回路,则舍弃这条边,转而观察加入次小边。

排序后的情况

用红线将舍弃的边删除后,剩余的就成为了最小生成树了。

时间复杂度

若e 表示图的边数,那么,排序过程将有O(eloge),生成过程则是O(e),故总的来说,时间复杂度为O(eloge)。

普林(Prim )算法

克鲁斯卡尔算法以边为出发点,相应地,普林算法则以点为出发点。从指定顶点开始将它加入集合中,然后将集合内的顶点与集合外的顶点所构成的所有边中选取权值最小的一条边作为生成树的边,并将集合外的那个顶点加入到集合中,表示该顶点已连通。再用集合内的顶点与集合外的顶点构成的边中找最小的边,并将相应的顶点加入集合中。如此下去直到全部顶点都加入到集合中,即得最小生成树。以点作为出发点很好地解决了克鲁斯卡尔算法解决边数很多的图的可怕时间复杂度的问题。边数不是制约普林算法的因素,结点才是。

普林算法的简单演算步骤:

(1)初始化集合A(),表示没有点以加入到生成结点中,初始化集合B ,使B 包含所有结点;

(2)从B 中选择一个点作为始加入到A 中并从B 中剔除; (3)选择A 中所有的点中能到达B 的最小权值边,将这条边的另一个点加入到A 中并从B 中剔除;

(4)重复(3)操作直至B 为NULL ,则为最小生成树。

邻接矩阵

如果说克鲁斯卡尔算法使用自定义的边集数组存储图是直观的,那么普林算法采用自定义的点集数组也是合适的?如果以某一点作为单独的数据结构,那么这一数据结构应当包含有与这个点有关的边的所有信息——权值和对应点。但事前我们并不知道这个图的点的最大度数为多少,带着这种未知来定义struct 是危险的,所以我们应当采用邻接矩阵——一个存放顶点间关系(边或弧)的数据的二维矩阵,即有一个二维矩阵data ,data[a][b]=c表示a 结点和b 结点有一条长为c 的边,相应地,data[b][a]=c。当a,b 之间没有边的时候,应当使data[a][b] = INF(INF 表示无穷)。

集合

由演算步骤中得知我们需要抽象出一个集合的概念,用以分开集合A 和集合B 。对于这种简单的区分,大可不必抽象出对象出来。运用克鲁斯卡尔中used 数组的概念也可模拟出这种集合,当used[i]等于特定值代表结点i 在哪个集合中即可。

初始化used 状态(等于0代表在B 中)

memset(used,0,sizeof(used));

然后选取第一结点来实现(2)操作

used[0] = 1 ;

优化(3)

(3)选择A 中所有的点中能到达B 的最小权值边,将这条边的另一个点加入到A 中并从B 中剔除;

如何寻找最小权值边?如果直观地去做,从A 中各点遍历,那么每加入一个点到A 所费的时间也是惊人的,所以也引入两个数组来作优化。

lowcost 数组:lowcost[i]表示A 集合中到结点i(I必然在集合B 中) 的; closest 数组:对应与lowcost ,表示结点i 到集合A 的用最小权值边连通的 所以当(2)中采用了第一结点,那么这个数组应当被初始化为

for(int kn = 1; kn

lowcost[kn] = data[0][kn]; closest[kn] = 0 ; }

当进行(3)时只需这样寻找

for(int i = 0 ; i

if( !used[i] && lowcost[i]

min = lowcost[i] ; min_site = i ; } }

每执行一次(3)都需要对着两个数组进行更新

for (int ks = 0 ; ks

if (!used[ks] && (data[min_site][ks]

owcost[ks] = data[min_site][ks]; closest[ks] = min_site ; } }

时间复杂度

若n 表示图的结点数,那么初始化需要O(n),找出最小边O(n),更新为O(n),需要找出与更新n 次,总的为O(n*(2n)+n),即O(n*n)。

最短路径

最短路径问题是图论研究中的一个经典算法问题, 旨在寻找图(由结点和路径组成的)中两结点之间的最短路径。

从1到4最短路径

迪杰斯特拉(Dijkstra )算法

Dijkstra(迪杰斯特拉) 算法是典型的最短路径路由算法,用于计算一个节点到其他节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra 算法能得出最短路径的最优解。但是,由于它遍历计算的节点很多,所以效率低。

基本思想

设置顶点集合S 并不断地作贪心选择来扩充这个集合。一个顶点属于集合S 当且仅当从源到该顶点的最短路径长度已知。

初始时,S 中仅含有源。设u 是G 的某一个顶点,把从源到u 且中间只经过S 中顶点的路称为从源到u 的特殊路径,并用数组dist 记录当前每个顶点所对应的最短特殊路径长度。迪杰斯特拉算法每次从所有特殊路径中取出最短特殊路径及其顶点u ,将u 添加到S 中,同时对数组dist 作必要的修改。一旦S 包含了所有V 中顶点,dist 就记录了从源到所有其它顶点之间的最短路径长度。

简单模拟

沿用克鲁斯卡尔算法used 数组来模拟集合S 。

初始化:结点1作为源点,此时的特殊路径有{1-2、1-3、1-4},最短特殊路径为1-3

明显结点3到源点的最短路径已定,则结点3也在S 集合中,dist[3]被赋值为10。 S 加入结点3后,特殊路径有{1-21-31-4、1-3-2、1-3-5},最短特殊路径为1-3-5

明显结点5到源点的最短路径已定,则结点5也在S 集合中,dist[5]被赋值为11。 以此类推,直到所有的点的dist 被计算出来。

难点

无论是边集数组还是邻接矩阵来存储图,对迪杰斯特拉算法来说影响不大,或者说各有各的优劣,视问题分析而定。由上面的分析可以看出,迪杰斯特拉算法的难点在于在特殊路径中找出最短的那条并最后将它删除。对于这种情况,其实我们可以构造一个类来存储最短特殊路径,并使它对特殊路径具有push 、pop 、sort 等的功能。不过STL 也提供了类似的类——priority_queue。

弗洛伊德沃舍尔(Warshall )算法

沃舍尔算法只需要使用2n^3次位运算就可以求出传递闭包。

传递闭包

在数学中,在集合 X 上的二元关系 R 的传递闭包是包含 R 的 X 上的最小的传递关系。当图中点边关系以邻接矩阵给出时,利用沃舍尔算法能够在O(n^3)内算出每点到各个点的最短路径,并以邻接矩阵形式给出。

五行代码之美

共有num_pl个结点,place[i][j]表示结点i 到结点j 的边权值为place[i][j],不存在边时则赋值

最小生成树and 最短路径

无独有偶,在两个学期的期末中两门不同的科目《离散数学》和《数据结构》中都谈到了图及其衍生的最小生成树、最短路径问题,并给出了相应的算法——克鲁斯卡尔、普林、迪杰斯特拉、沃舍尔算法。这无疑是释放了一个很大的信号——这些内容很重要。由于之前学《离散数学》时只要求在思想上理解,并没要求程序实现,所以学起来也挺吃力的。而现在来到了《数据结构》的课程上,我觉得还是有必要写写理解与体会,好让以后用起来没那么难。

最小生成树(Minimum Spanning Tree,MST )

一个有 n 个结点的连通图的生成树是原图的极小连通子图,且包含原图中的所有 n 个结点,并且有保持图连通的最少的边。即是在原图上删除边,直到剩余n-1条边,保证n 个结点连通且边的权值加起来最小。

简单图示:

克鲁斯卡尔(Kruskal )算法

克鲁斯卡尔算法从边的角度来解决问题,即在剩下的所有未选取的边中,找最小边,如果和已选取的边构成回路,则放弃,选取次小边。然而,图的存贮结构采用边集数组,且权值相等的边在数组中排列次序可以是任意的,该方法对于边数相对比较多的图不是很实用,浪费时间。可以说克鲁斯卡尔算法是很直观的算法,适合人的直观思考方式,但是因为上面论述的缘故,克鲁斯卡尔算法比较适用在稀疏图(边的数目不是很多的图)上。

边集数组:

从图变为程序需要的数据,需要采用合适的数据结构。由算法的核心思想上看,我们需要存储的数据为边,而边的要素包括三点:连接的两个结点、边的权值。然而边并不需要具有什么操作来改变自身或者做些什么,所以用struct 来自定义就合适不过了。

struct edge{ int node_1; int node_2; int value ; };

另外,文中提及了最小边、次小边,这就暗示了应该对所有的边进行排序(sort )。 比较函数应以value 作衡量。

bool cmp(edge a , edge b) {

return a.value

现在剩余最后的问题——回路的避免。其实这个也很容易避免,我们可以定义一个数组used[max],它记录了每一个结点是否被应用的情况,当要加入的一条边中used[a.node_1]和 used[a.node_2]都已被应用,那么加入的这条边必然造成回路,否则不会。若造成回路,则舍弃这条边,转而观察加入次小边。

排序后的情况

用红线将舍弃的边删除后,剩余的就成为了最小生成树了。

时间复杂度

若e 表示图的边数,那么,排序过程将有O(eloge),生成过程则是O(e),故总的来说,时间复杂度为O(eloge)。

普林(Prim )算法

克鲁斯卡尔算法以边为出发点,相应地,普林算法则以点为出发点。从指定顶点开始将它加入集合中,然后将集合内的顶点与集合外的顶点所构成的所有边中选取权值最小的一条边作为生成树的边,并将集合外的那个顶点加入到集合中,表示该顶点已连通。再用集合内的顶点与集合外的顶点构成的边中找最小的边,并将相应的顶点加入集合中。如此下去直到全部顶点都加入到集合中,即得最小生成树。以点作为出发点很好地解决了克鲁斯卡尔算法解决边数很多的图的可怕时间复杂度的问题。边数不是制约普林算法的因素,结点才是。

普林算法的简单演算步骤:

(1)初始化集合A(),表示没有点以加入到生成结点中,初始化集合B ,使B 包含所有结点;

(2)从B 中选择一个点作为始加入到A 中并从B 中剔除; (3)选择A 中所有的点中能到达B 的最小权值边,将这条边的另一个点加入到A 中并从B 中剔除;

(4)重复(3)操作直至B 为NULL ,则为最小生成树。

邻接矩阵

如果说克鲁斯卡尔算法使用自定义的边集数组存储图是直观的,那么普林算法采用自定义的点集数组也是合适的?如果以某一点作为单独的数据结构,那么这一数据结构应当包含有与这个点有关的边的所有信息——权值和对应点。但事前我们并不知道这个图的点的最大度数为多少,带着这种未知来定义struct 是危险的,所以我们应当采用邻接矩阵——一个存放顶点间关系(边或弧)的数据的二维矩阵,即有一个二维矩阵data ,data[a][b]=c表示a 结点和b 结点有一条长为c 的边,相应地,data[b][a]=c。当a,b 之间没有边的时候,应当使data[a][b] = INF(INF 表示无穷)。

集合

由演算步骤中得知我们需要抽象出一个集合的概念,用以分开集合A 和集合B 。对于这种简单的区分,大可不必抽象出对象出来。运用克鲁斯卡尔中used 数组的概念也可模拟出这种集合,当used[i]等于特定值代表结点i 在哪个集合中即可。

初始化used 状态(等于0代表在B 中)

memset(used,0,sizeof(used));

然后选取第一结点来实现(2)操作

used[0] = 1 ;

优化(3)

(3)选择A 中所有的点中能到达B 的最小权值边,将这条边的另一个点加入到A 中并从B 中剔除;

如何寻找最小权值边?如果直观地去做,从A 中各点遍历,那么每加入一个点到A 所费的时间也是惊人的,所以也引入两个数组来作优化。

lowcost 数组:lowcost[i]表示A 集合中到结点i(I必然在集合B 中) 的; closest 数组:对应与lowcost ,表示结点i 到集合A 的用最小权值边连通的 所以当(2)中采用了第一结点,那么这个数组应当被初始化为

for(int kn = 1; kn

lowcost[kn] = data[0][kn]; closest[kn] = 0 ; }

当进行(3)时只需这样寻找

for(int i = 0 ; i

if( !used[i] && lowcost[i]

min = lowcost[i] ; min_site = i ; } }

每执行一次(3)都需要对着两个数组进行更新

for (int ks = 0 ; ks

if (!used[ks] && (data[min_site][ks]

owcost[ks] = data[min_site][ks]; closest[ks] = min_site ; } }

时间复杂度

若n 表示图的结点数,那么初始化需要O(n),找出最小边O(n),更新为O(n),需要找出与更新n 次,总的为O(n*(2n)+n),即O(n*n)。

最短路径

最短路径问题是图论研究中的一个经典算法问题, 旨在寻找图(由结点和路径组成的)中两结点之间的最短路径。

从1到4最短路径

迪杰斯特拉(Dijkstra )算法

Dijkstra(迪杰斯特拉) 算法是典型的最短路径路由算法,用于计算一个节点到其他节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra 算法能得出最短路径的最优解。但是,由于它遍历计算的节点很多,所以效率低。

基本思想

设置顶点集合S 并不断地作贪心选择来扩充这个集合。一个顶点属于集合S 当且仅当从源到该顶点的最短路径长度已知。

初始时,S 中仅含有源。设u 是G 的某一个顶点,把从源到u 且中间只经过S 中顶点的路称为从源到u 的特殊路径,并用数组dist 记录当前每个顶点所对应的最短特殊路径长度。迪杰斯特拉算法每次从所有特殊路径中取出最短特殊路径及其顶点u ,将u 添加到S 中,同时对数组dist 作必要的修改。一旦S 包含了所有V 中顶点,dist 就记录了从源到所有其它顶点之间的最短路径长度。

简单模拟

沿用克鲁斯卡尔算法used 数组来模拟集合S 。

初始化:结点1作为源点,此时的特殊路径有{1-2、1-3、1-4},最短特殊路径为1-3

明显结点3到源点的最短路径已定,则结点3也在S 集合中,dist[3]被赋值为10。 S 加入结点3后,特殊路径有{1-21-31-4、1-3-2、1-3-5},最短特殊路径为1-3-5

明显结点5到源点的最短路径已定,则结点5也在S 集合中,dist[5]被赋值为11。 以此类推,直到所有的点的dist 被计算出来。

难点

无论是边集数组还是邻接矩阵来存储图,对迪杰斯特拉算法来说影响不大,或者说各有各的优劣,视问题分析而定。由上面的分析可以看出,迪杰斯特拉算法的难点在于在特殊路径中找出最短的那条并最后将它删除。对于这种情况,其实我们可以构造一个类来存储最短特殊路径,并使它对特殊路径具有push 、pop 、sort 等的功能。不过STL 也提供了类似的类——priority_queue。

弗洛伊德沃舍尔(Warshall )算法

沃舍尔算法只需要使用2n^3次位运算就可以求出传递闭包。

传递闭包

在数学中,在集合 X 上的二元关系 R 的传递闭包是包含 R 的 X 上的最小的传递关系。当图中点边关系以邻接矩阵给出时,利用沃舍尔算法能够在O(n^3)内算出每点到各个点的最短路径,并以邻接矩阵形式给出。

五行代码之美

共有num_pl个结点,place[i][j]表示结点i 到结点j 的边权值为place[i][j],不存在边时则赋值


相关内容

  • 图论算法(经典)
  • 图论算法 最小生成树算法(Prim算法) 单源最短路径算法(Dijkstra算法) 任意结点最短路径算法(Floyd算法) 求有向带权图的所有环 Bellman-Ford 算法 计算图的连通性 计算最佳连通分支 计算拓扑序列 图论算法习题 网络建设问题 最短变换问题 挖地雷 乌托邦城市 乌托邦交通中 ...

  • 备战NOIP的基本要素--基本算法
  • 备战NOIP 的基本要素--基本算法 一.数论算法 1.求两数的最大公约数 function gcd(a,b:integer):integer; begin if b=0 then gcd:=a else gcd:=gcd (b,a mod b); end ; 2.求两数的最小公倍数 functio ...

  • 中国邮递员问题各种算法的对比分析
  • 附录2 <图论>课程专题论文 论文题目: 中国邮递员问题各种算法的对比分析 班 级: 2008级数学与应用数学 组 长:马利巍 2011年 12 月 27 日 论文评价指标与鉴定意见 摘要 本文基于无向图的传统中国邮递员问题,给出了相应的显式整数规划模型,进一步讨论了一类基于有向图的广义 ...

  • 一些经典的图论算法(C++描述)
  • 一些经典的图论算法,C++描述. #include // 常量定义: const int maxV = 100 ; const double Inf = 1e100; // const int Inf=2000000000; // Graph类定义: template struct GraphMat ...

  • 微软2013校园招聘笔试
  • 2. 下面哪一项不能用于Widows中进程间通信? A. 命名事件 B. 命名管道 C. 临界区 D. 共享内存 3. 下面哪一种操作不是stack的基本操作? A. 入栈 B. 出栈 C. 检查是否为空 D. 排序栈中元素 4. 下面哪一种属于"creational"的设计模式 ...

  • 基于四阶段法的城市轨道交通客流预测模型研究
  • 基于四阶段法的城市轨道交通客流预 测模型研究 摘 要 关键词:轨道交通客流预测通过预测线路断面流量.换乘流量.车站出入口流量为规划线网方案的评价.轨道建设提供重要的量化指标,其对于轨道交通项目的科学决策具有重要的意义. 本文主要内容如下: (1)阐述国内外轨道交通预测研究现状和发展趋势,研究背景和研 ...

  • 网络最短路问题的改进算法
  • 第23卷第9期 2002年9月 文章编号:1000-1220(2002) 09-1083-05 小型微型计算机系统M IN I -M I CRO SY ST EM V ol. 23N o. 9 Sep . 2002 网络最短路问题的改进算法 王晓东 陈国龙 林柏钢 (福州大学计算机科学与技术系, 福 ...

  • 数据结构图的应用报告
  • 数据结构课程设计图的应用个人报告 1979:Red and Black 第一.题目理解 有一个长方形的房间,覆盖平方米瓷砖.每一层的颜色或是红色或黑色.一名男子正站在一个黑色的瓷砖.从瓷砖,他可以转移到四个相邻瓷砖.但是他不能进入红色瓷砖,他只能移动黑砖.写程序的数量黑色瓦片,他可以达到通过重复上述 ...

  • GIS在交通运输系统中的应用
  • 董苓:地理信息系统在交通运输管理中的应用 地理信息系统在交通运输管理中的应用 董苓 交通运输学院1204班 摘 要: 全社会数字化进程逐步加快,地理信息系统作为人口.资源与环境问题的公共平台,作为国家推动信息化.实现现代化的重要组成部分,在各个领域起着越来越重要的作用.本文首先系统的介绍了地理信息系 ...