Part 4.5：拓扑排序——安排任务的艺术

引言：当任务有了先后顺序

想象一下你正在选大学课程，"算法导论" 依赖于 "数据结构"，而 "数据结构" 又依赖于 "离散数学"。你必须按照 "离散数学" -> "数据结构" -> "算法导论" 的顺序来学习。或者，在编译一个项目时，编译器必须先编译被依赖的模块，然后才能编译依赖它们的模块。

这些场景都有一个共同点：任务之间存在有向的依赖关系，并且这些关系中不能有循环（你不能让课程 A 依赖 B，同时 B 又依赖 A）。这种带有方向且无环的图被称为**有向无环图 (Directed Acyclic Graph, DAG)**。

拓扑排序 (Topological Sort) 就是对一个 DAG 的顶点进行线性排序，使得对于图中任意一条有向边 (u, v)，顶点 u 在排序中都出现在顶点 v 之前。

注意：一个图的拓扑排序结果可能不唯一。

核心概念

**有向无环图 (DAG)**：拓扑排序的唯一适用对象。如果一个有向图包含环，那么它就不存在拓扑排序。
**入度 (In-degree)**：指向一个顶点的边的数量。
**出度 (Out-degree)**：从一个顶点出发的边的数量。

两种经典算法

1. Kahn 算法 (基于 BFS)

Kahn 算法是一种基于广度优先搜索 (BFS) 的拓扑排序算法，它的思想非常直观，就像我们在现实世界中安排任务一样。

核心思想：

首先，找到所有入度为 0 的顶点。这些是没有任何前置依赖的顶点，可以作为起点。
将这些顶点放入一个队列中。
当队列不为空时，从队列中取出一个顶点 u，将其加入拓扑排序结果中。
然后，遍历 u 的所有邻居 v（即 u 指向的顶点），将边 (u, v) “移除”，这等价于将 v 的入度减 1。
如果 v 的入度在减 1 后变为 0，说明 v 的所有前置依赖都已完成，可以将 v 加入队列。
重复此过程，直到队列为空。

环路检测：如果算法结束后，拓扑排序结果中的顶点数量小于图中的总顶点数，说明图中存在环路。

2. 基于 DFS 的算法

我们也可以使用深度优先搜索 (DFS) 来实现拓扑排序。

核心思想：

一个顶点 u 的所有后继顶点（u 能到达的顶点）都访问完毕后，u 才能被加入到拓扑排序结果中。

这启发我们，拓扑排序的结果实际上是所有顶点完成 DFS 访问的逆序。

算法步骤：

创建一个列表 result 用于存储拓扑排序结果。
创建一个集合 visited 用于记录已访问的顶点。
遍历所有顶点，如果顶点未被访问，则对其进行 DFS。
在 DFS 函数中：
a. 将当前顶点标记为已访问。
b. 递归地对所有未被访问的邻居进行 DFS。
c. 当一个顶点的所有邻居都已被访问后，将该顶点插入到 result 列表的头部。

环路检测：在 DFS 过程中，我们需要维护一个 recursion_stack 来记录当前递归路径上的顶点。如果在访问一个顶点的邻居时，发现该邻居已经在 recursion_stack 中，说明遇到了一个反向边，即图中存在环路。

Python 实现

Kahn 算法实现

from collections import deque, defaultdict

def kahn_topological_sort(graph, nodes):
    """
    Kahn 算法实现拓扑排序
    graph: 邻接表 {node: [neighbors...]}
    nodes: 所有节点的列表
    返回: 拓扑排序列表，如果存在环则返回 None
    """
    # 1. 计算所有节点的入度
    in_degree = {node: 0 for node in nodes}
    for u in graph:
        for v in graph[u]:
            in_degree[v] += 1
    
    # 2. 将所有入度为 0 的节点入队
    queue = deque([node for node in nodes if in_degree[node] == 0])
    
    result = []
    while queue:
        u = queue.popleft()
        result.append(u)
        
        # 3. "移除" u 的所有出边
        if u in graph:
            for v in graph[u]:
                in_degree[v] -= 1
                # 4. 如果邻居入度变为 0，入队
                if in_degree[v] == 0:
                    queue.append(v)
    
    # 5. 环路检测
    if len(result) == len(nodes):
        return result
    else:
        return None  # 存在环路

# --- 案例测试 ---
nodes = ['A', 'B', 'C', 'D', 'E', 'F']
graph = {
    'A': ['B', 'C'],
    'B': ['D'],
    'C': ['D'],
    'D': ['E'],
    'F': ['C', 'E']
}

result_kahn = kahn_topological_sort(graph, nodes)
print(f"Kahn 算法拓扑排序结果: {result_kahn}")
# 可能的输出: ['A', 'F', 'B', 'C', 'D', 'E']

DFS 算法实现

def dfs_topological_sort(graph, nodes):
    """
    DFS 算法实现拓扑排序
    返回: 拓扑排序列表，如果存在环则返回 None
    """
    result = []
    visited = set()  # 记录已完成 DFS 的节点
    recursion_stack = set()  # 记录当前递归路径上的节点，用于判环

    def _dfs(u):
        visited.add(u)
        recursion_stack.add(u)
        
        if u in graph:
            for v in graph[u]:
                if v not in visited:
                    if not _dfs(v):
                        return False  # 发现环
                elif v in recursion_stack:
                    return False  # 发现环
        
        recursion_stack.remove(u)
        result.insert(0, u)  # 在头部插入
        return True

    for node in nodes:
        if node not in visited:
            if not _dfs(node):
                return None  # 存在环路
    
    return result

# --- 案例测试 ---
result_dfs = dfs_topological_sort(graph, nodes)
print(f"DFS 算法拓扑排序结果: {result_dfs}")
# 可能的输出: ['F', 'A', 'C', 'B', 'D', 'E']

复杂度分析

对于两种算法，时间复杂度和空间复杂度都是相同的：

时间复杂度: O(V + E)。我们需要遍历每个顶点和每条边一次。
空间复杂度: O(V + E)。用于存储图、入度数组/访问集合以及队列/递归栈。

经典应用

任务调度：在 make 等构建系统中，确定文件的编译顺序。
课程安排：根据课程的先修要求，安排学习顺序。
依赖解析：在包管理器（如 npm, pip）中，确定软件包的安装顺序。
在 DAG 中寻找最短/最长路径：通过拓扑排序，我们可以将 DAG 的最短/最长路径问题转化为一个简单的动态规划问题，时间复杂度仅为 O(V + E)。

总结

拓扑排序是处理有向无环图 (DAG) 中依赖关系的核心工具。它为我们提供了一种将偏序关系线性化的方法，在计算机科学的许多领域都有着重要的应用。

本文核心要点

✅ 拓扑排序：对 DAG 的顶点进行线性排序，以满足所有依赖关系。
✅ Kahn 算法 (BFS)：基于入度，不断将入度为 0 的顶点加入队列处理。直观且易于理解。
✅ DFS 算法：基于递归，拓扑序是完成 DFS 访问的逆序。
✅ 环路检测：两种算法都能有效地检测图中是否存在环路。
✅ 时间复杂度：均为 O(V + E)。

掌握了拓扑排序，你就拥有了解决一系列任务调度和依赖解析问题的能力。在下一篇文章中，我们将学习一个更高级的概念——强连通分量，看看如何将一个复杂的有向图分解成若干个“紧密”的部分。

大学算法全体系 > Part 4：图论算法

#DFS #图论 #拓扑排序 #DAG #有向无环图 #Kahn算法 #算法应用

Part 4.5：拓扑排序——安排任务的艺术

https://hjjjkh.github.io/posts/cee53c4f

作者

李国强

发布于

2025年11月26日

许可协议

Part 4.6：强连通分量 (SCC)——将复杂图分解为核心簇上一篇

Part 4.4：多源最短路与负权环 (Bellman-Ford & Floyd-Warshall) 下一篇