Part 1.2：时间复杂度推导方法大全

引言：从“会用”到“会算”

在上一篇文章 Part 1.1 中，我们知道了什么是时间复杂度，也理解了 O(n)、O(n²) 这些符号代表着算法效率的巨大差异。这就像我们知道了不同汽车的最高时速，但如果我们想成为一名赛车工程师，就必须懂得如何分析发动机的内部构造，精确计算出它的性能极限。

复杂度分析就是算法世界的“性能工程学”。只知道 O(n) 比 O(n²) 好是远远不够的。在面试和实际工作中，你会遇到各种各样的代码：嵌套循环、带有 if-else 的循环、递归调用、甚至是不规则变化的循环……你必须能像庖丁解牛一样，精准地剖析出任何一段代码的时间复杂度。

为什么掌握推导方法如此重要？

面试价值：面试官不仅想看你写出代码，更想听你清晰地讲出这段代码的时间和空间复杂度是多少，以及为什么是这个复杂度。这是衡量你算法基本功的黄金标准。
工程价值：在设计系统时，你需要预估代码在百万、千万甚至上亿数据量下的性能表现。错误的复杂度分析可能导致线上系统崩溃。例如，将一个 O(n log n) 的算法误判为 O(n)，在高并发场景下可能是灾难性的。

本文将为你提供一个完整的时间复杂度推导工具箱，从最基础的循环、分支结构，到最令人头疼的递归，让你彻底从“感觉它很快”的模糊直觉，进化到“我能证明它有多快”的严谨分析。

背景知识：两大基本法则

在开始推导之前，我们必须先掌握复杂度分析的两个最基本的法则：加法法则和乘法法则。

1. 加法法则 (Rule of Sum)

定义：如果一个任务由两个独立的步骤组成，步骤 A 的复杂度是 T₁(n) = O(f(n))，步骤 B 的复杂度是 T₂(n) = O(g(n))，那么完成整个任务的复杂度是 T(n) = T₁(n) + T₂(n) = O(max(f(n), g(n)))。

直觉：做完一件事，再做另一件事，总时间取决于更耗时的那件事。

代码形态：顺序执行的代码块。

# 步骤 A: O(n)
for i in range(n):
    print(i)

# 步骤 B: O(n²)
for i in range(n):
    for j in range(n):
        print(i, j)

分析：总复杂度 = O(n) + O(n²) = O(max(n, n²)) = O(n²)。

2. 乘法法则 (Rule of Product)

定义：如果一个任务由两个嵌套的步骤组成，步骤 A 重复执行了 O(f(n)) 次，每次执行步骤 A 时，步骤 B 都要执行 O(g(n)) 次，那么完成整个任务的复杂度是 T(n) = O(f(n) * g(n))。

直觉：一件事里面嵌套着另一件事，总次数是两者相乘。

代码形态：嵌套循环。

# 外层循环: O(n)
for i in range(n):
    # 内层循环: O(n)
    for j in range(n):
        print(i, j)

分析：总复杂度 = O(n) * O(n) = O(n²)。

掌握了这两个基本法则，我们就可以分析大部分非递归算法了。

Part A：循环结构复杂度分析

循环结构是最常见的代码形态，其复杂度分析的核心是确定循环体的执行总次数。

1. O(1) - 常数级

关键特征：代码的执行次数与输入规模 n 无关。

def swap(a, b):
    temp = a
    a = b
    b = temp

分析：无论 a 和 b 的值是什么，这段代码都只执行固定的 3 次操作。因此，时间复杂度为 O(1)。

2. O(n) - 线性级

关键特征：循环次数与输入规模 n 成正比。

def find_max(arr):
    max_val = arr[0]
    # 循环 n-1 次
    for i in range(1, len(arr)):
        if arr[i] > max_val:
            max_val = arr[i]
    return max_val

分析：for 循环的执行次数为 n-1。根据大 O 表示法，忽略常数 -1 和系数 1，时间复杂度为 O(n)。

3. O(n²) - 平方级

关键特征：双层嵌套循环，每层循环都与 n 相关。

动画式案例：分析三角循环

def print_triangle(n):
    for i in range(n): # 外层执行 n 次
        for j in range(i): # 内层执行次数与 i 相关
            print("*")

推导过程：

步骤分解：外层循环 i 从 0 到 n-1。内层循环 j 从 0 到 i-1。
计算总次数：
- 当 i = 0 时，内层循环执行 0 次。
- 当 i = 1 时，内层循环执行 1 次。
- 当 i = 2 时，内层循环执行 2 次。
- …
- 当 i = n-1 时，内层循环执行 n-1 次。
数学求和：总执行次数 T(n) = 0 + 1 + 2 + ... + (n-1)。这是一个等差数列求和。
T(n) = (0 + n-1) * n / 2 = (n² - n) / 2 = 0.5n² - 0.5n
大 O 简化：
- 保留最高阶项 0.5n²。
- 忽略系数 0.5。
- 最终时间复杂度为 **O(n²)**。

直觉：虽然内层循环次数在变化，但其平均执行次数是 n/2 级别。根据乘法法则，n * (n/2) 依然是 n² 级别。

4. O(log n) - 对数级

关键特征：循环变量 i 的步长不是固定的 +1，而是呈指数级增长（如 *2）或指数级衰减（如 /2）。

动画式案例：分析 `i *= 2`

def logarithmic_loop(n):
    i = 1
    while i < n:
        print(i)
        i = i * 2

推导过程：

步骤分解：我们观察变量 i 的变化过程。
- 循环 1 次：i = 1
- 循环 2 次：i = 2
- 循环 3 次：i = 4
- 循环 4 次：i = 8
- …
- 循环 k 次：i = 2^(k-1)
寻找终止条件：循环在 i >= n 时终止。假设循环了 k 次，那么 2^(k-1) >= n。
数学求解：
2^(k-1) = n
k-1 = log₂n
k = log₂n + 1
大 O 简化：总执行次数 k 与 log n 成正比。因此，时间复杂度为 **O(log n)**。

直觉：每执行一次，问题规模就缩小一半（或者说变量 i 离 n 的距离缩小一半），这种“减半”或“翻倍”的特性就是对数复杂度的典型特征。

Part B：递归结构复杂度分析

递归算法的复杂度分析是难点，也是面试的重点。因为它不能像循环一样简单地数次数。核心方法是写出递归关系式，然后求解。

1. 递归关系式 (Recurrence Relation)

一个递归关系式通常形如：T(n) = a * T(n/b) + f(n)

T(n)：处理规模为 n 的问题的总时间。
a：每次递归中产生的子问题数量。
T(n/b)：每个子问题的规模。
f(n)：本次递归调用中，除了递归调用之外的计算开销（如合并、分解等）。

2. 方法一：递归树分析法 (Recursion Tree Method)

这是最直观、最通用的方法。核心思想是把递归调用过程画成一棵树，然后计算整棵树的总工作量。

动画式案例：分析归并排序

归并排序的伪代码如下：

function merge_sort(arr):
  if length(arr) <= 1: return arr
  
  mid = length(arr) / 2
  left = merge_sort(arr[0...mid])  // 递归调用1
  right = merge_sort(arr[mid...end]) // 递归调用2
  
  return merge(left, right) // 合并操作

推导过程：

写出递归关系式：
- a = 2：产生了 left 和 right 两个子问题。
- n/b = n/2：每个子问题的规模是原问题的一半。
- f(n) = O(n)：merge 操作需要遍历左右两个子数组，开销是线性的。
- 所以，T(n) = 2 * T(n/2) + O(n)。
画出递归树：

图片来源：Stack Overflow
>
> Level 0 (Root): 根节点代表整个问题，规模为 n。本层 merge 开销为 c*n。
> Level 1: 根节点分裂成 2 个子节点，每个子问题规模为 n/2。本层总开销为 2 * c*(n/2) = c*n。
> Level 2: 2 个子节点再分别分裂，共 4 个孙节点，每个规模为 n/4。本层总开销为 4 * c*(n/4) = c*n。
> …
> Level k (Leaf): 当子问题规模为 1 时到达叶子节点。n / 2^k = 1，所以树的高度 k = log₂n。

计算总工作量：
- 树的高度（递归深度）为 log n。
- 每一层的工作量都是 c*n。
- 总工作量 = 每层工作量 * 树的高度 = c*n * log n。
大 O 简化：时间复杂度为 **O(n log n)**。

3. 方法二：主定理 (Master Theorem)

主定理是一个强大的公式，可以秒解形如 T(n) = a * T(n/b) + O(n^d) 的递归关系式。

主定理的三种情况：

Case 1: 如果 logᵦa > d，则 T(n) = O(n^(logᵦa))。
- 直觉：递归子问题的总数增长速度快于分解/合并的开销。复杂度由子问题数量决定。
Case 2: 如果 logᵦa = d，则 T(n) = O(n^d * log n)。
- 直觉：子问题数量与分解/合并开销的增长速度相当。复杂度需要额外乘以一个 log n 因子（树的高度）。
Case 3: 如果 logᵦa < d，则 T(n) = O(n^d)。
- 直觉：分解/合并的开销增长速度超过了子问题数量。复杂度由分解/合并开销决定。

动画式案例：用主定理再解归并排序

递归关系式：T(n) = 2 * T(n/2) + O(n¹)。
参数匹配：
- a = 2
- b = 2
- d = 1
**计算 logᵦa**：log₂2 = 1。
比较大小：logᵦa = 1，d = 1。所以 logᵦa = d。
应用 Case 2：T(n) = O(n^d * log n) = O(n¹ * log n) = O(n log n)。

结果与递归树法完全一致，但速度快得多！

总结与思维导图

今天我们系统学习了时间复杂度的推导方法，这是算法内功的核心。

核心要点回顾

两大基本法则：加法法则（顺序结构取最大）和乘法法则（嵌套结构相乘）。
循环结构分析：关键是确定循环总次数。O(n)、O(n²)、O(log n) 是最常见的类型。
递归结构分析：关键是写出递归关系式 T(n) = a * T(n/b) + f(n)。
递归求解两大方法：
- 递归树法：直观通用，画出树形结构，计算整棵树的总工作量。
- 主定理：特定形式的“公式法”，通过比较 logᵦa 和 d 的大小来快速求解。

思维导图

思维导图：总结了本文的核心分析方法

根节点: 复杂度分析
分支 1: 基本法则
叶子: 加法法则 (顺序, 取 max)
叶子: 乘法法则 (嵌套, 相乘)
分支 2: 循环结构
叶子: O(1) (固定次数)
叶子: O(n) (线性步长)
叶子: O(n²) (嵌套/三角)
叶子: O(log n) (指数步长)
分支 3: 递归结构
核心: 写出递归关系式
方法 1: 递归树法 (画图, 计算总量)
方法 2: 主定理 (公式, 比较 logᵦa 和 d)

掌握了这些方法，你就拥有了分析绝大多数算法时间复杂度的能力。在下一篇文章中，我们将探讨相对简单的空间复杂度推导方法，并做更多综合练习。

大学算法全体系 > Part 1：算法基础

#时间复杂度 #算法基础 #复杂度分析 #Big O #主定理

Part 1.2：时间复杂度推导方法大全

https://hjjjkh.github.io/posts/de782670

作者

李国强

发布于

2025年11月15日

许可协议

为 Hexo 博客添加 Gitalk 评论系统——从零到一的完整指南上一篇

Part 1.1：什么是算法？什么是复杂度？下一篇

Part 1.2：时间复杂度推导方法大全

引言：从“会用”到“会算”

背景知识：两大基本法则

1. 加法法则 (Rule of Sum)

2. 乘法法则 (Rule of Product)

Part A：循环结构复杂度分析

1. O(1) - 常数级

2. O(n) - 线性级

3. O(n²) - 平方级

动画式案例：分析三角循环

4. O(log n) - 对数级

动画式案例：分析 i *= 2

Part B：递归结构复杂度分析

1. 递归关系式 (Recurrence Relation)

2. 方法一：递归树分析法 (Recursion Tree Method)

动画式案例：分析归并排序

3. 方法二：主定理 (Master Theorem)

动画式案例：用主定理再解归并排序

总结与思维导图

核心要点回顾

思维导图

动画式案例：分析 `i *= 2`