平摊分析

平摊分析,又称摊还分析(英语:Amortized analysis)是计算机科学中的一种算法分析方法,常用于分析数据结构(特别是动态的数据结构)的复杂性。
对于某些数据结构来说,其操作在某些情况下需要耗费相当大的运算资源,但大部分时候开销显著小于最坏情况。如果只使用最坏情况分析,可能会错误地低估其在实际使用时的效率。由于输入的类型、长度等因素都可能影响某一操作的开销,平摊分析通过考虑一组包含了各种不同操作的序列,将少数开销较大的操作平摊至整个序列上,从而得出一个更贴合算法实际应用时的复杂度。[1]:306 [2]
应注意平摊分析与平均时间分析或概率算法分析的不同。平均时间分析中,平均化的是所有可能的输入;在概率算法的概率分析中,平均化的是所有可能的随机选择;而在平摊分析中,平均化的是一系列操作的耗费。平摊分析假设的是最坏情况输入并且通常不运行随机选择。[3]
历史
[编辑]1985年,美国计算机科学家罗伯特·塔扬首先在他的论文中提出了聚集法(现已归为平摊分析中的一种方法)。他在文章中指出,有必要开发一种比一般概率分析更实用的分析方法。[1]最初,平摊分析仅用于分析二叉树与并查集等少数几种算法。不过随着更多算法与数据结构的开发,平摊分析已经成为了一种计算机科学家普遍使用的分析方法。[2]
平摊分析种类
[编辑]在进行平摊分析前,首先要确认哪些操作序列是有可能出现的。对于数据结构这种具有持续性状态的算法来说,执行一次开销很大的操作可能会使得其进入一种不再可能执行大开销操作的状态。而再次执行这种大开销的操作之前,数据结构必须执行多次小开销的操作。平摊分析的思想就是将这些不频繁的大开销“平摊”至许多小开销上,从而得出更“平滑”的算法复杂性。
平摊分析主要有三种方法:聚集法、记账法和位能法。三种方法所得出的结果都是等价的。具体使用哪种方法应根据具体问题的性质,选择最简便的方法。[3]
聚集法
[编辑]聚集法(英语:Aggregate method)通过证明每个长度为n的操作序列所需的时间总和不超过一个上限函数T(n),然后将T(n)平摊至每一个操作,每一个操作的平摊成本就是T(n)/n。[3]
记账法
[编辑]记账法(英语:Accounting method),又称“银行家的方法”(英语:Banker's method),本质是聚集法的一个变种。记账法设想存在一名会计,在算法执行每个操作时为其发放一定量的“积分”。执行花费较低的操作时,算法可以将超出本次操作实际需要的积分存入“账户”,在未来执行花费较高的操作时再取出积分,支付当次操作不足的部分。如果能证明算法在执行这一系列操作时永远不会“透支”,那么就可以证明会计每次发放的积分数量就不小于这个算法的平摊复杂性。[3]
位能法
[编辑]位能法,或势能法(英语:Potential method),又称“物理学家的方法”(英语:Physicist's method),通过定义一个非负的位能函数(英语:Potential function),将数据结构的每个状态映射到一个实数。该函数本质上是统计了记账法中每一步数据结构所剩余的余额,但其计算时只取决于数据结构的当前状态,不考虑某一步骤之前的操作历史。使用位能法时,每一步操作的平摊复杂性被理解为其 实际开销 + 位能的改变量。
例子
[编辑]多重弹出堆栈
[编辑]我们定义一个特殊的堆栈,其具有下列操作:
操作 | 说明 | 实际开销 |
---|---|---|
S.push(x) | 将一个元素x押入堆栈S中 | |
S.pop() | 把堆栈最上面的元素弹出 | |
S.multi-pop(k) | 一次弹出k个元素 |
S.mult-pop(k)
的代码如下:
def multi_pop(k):
while (not S.empty()) and (k>0):
S.pop()
k -= 1
我们规定堆栈初始化时不含任何元素。
注意到,如果使用最坏情况分析n个操作的序列的复杂性会得出以下结论:n个操作中,堆栈中至多有个元素;每次执行S.mult-pop(k)
时的最坏复杂性是,因此在多重弹出堆栈上执行n个操作的最坏复杂性是。然而,显然这是不合理的,因为一次弹出k个元素需要至少先压入k个元素。
接下来我们分别使用聚集法、记账法与位能分别证明"堆栈一个操作的平摊成本是"
使用聚集法证明
[编辑]令是所有S.push(x)
操作的总开销,是所有S.pop()
的总开销,是所有S.multi-pop(k)
的总开销。
注意到,堆栈中的元素个数永远为非负,且初始为空。因此,有。
假设是执行个操作的时间复杂度,则其有如下上界:
至此,可以证明在多重弹出堆栈上的任意n长度的操作序列的平摊成本为。[4]
使用记账法证明
[编辑]我们规定,为S.push(x)
、S.pop()
、S.multi-pop(k)
的分别发放2、0、0个积分,如下表所示
操作 | 实际开销 | 发放积分 |
---|---|---|
S.push(x) | 1 | 2 |
S.pop() | 1 | 0 |
S.multi-pop(k) | 0 |
我们需要证明对于任意n长度的操作序列,其存款数永远为非负,即:
注意到,每个元素在压入堆栈时获得2积分,本次操作消耗1积分的同时存入1积分,因此不论通过何种方法弹出时,一定可以取出压入时存入的1积分,因此存款始终为非负。
至此,可以证明在多重弹出堆栈上的任意n长度的操作序列的平摊成本为。[5]
使用位能法证明
[编辑]我们定义位能函数为执行i个操作后,堆栈内的元素个数。显然,是非负的:
- ,因为堆栈一开始是空的
- ,因为堆栈的元素个数一定
计算堆栈S每一个操作的平摊成本。假设 S 在状态时有 个元素:
操作 | 平摊成本 |
---|---|
S.push(x) | |
S.pop() | |
S.multi-pop(k) |
可见每个操作的平摊成本都是,因此任意n长度的操作序列的平摊成本就是。[4]
动态数组
[编辑]
考虑一个随元素个数增加而增长的动态数组,比如Java的ArrayList或者C++的std::vector。如果我们的数组大小从4开始,那么来向其中增加四个元素的时间就是一个常数。然而,若要将第五个元素加入其中,那么会花费更多时间,因为我们此时必须要创建一个两倍于当前数组大小的数组(8个元素),把老元素拷贝到新数组中,然后增加一个新元素。接下来的三次加入操作也同样会花费常数时间,然后在数组被填满后则又需要一轮新的加倍扩充。
一般地,如果我们考虑任意一个任意的n大小的数组并对其进行n + 1次加入操作。我们注意到,所有的加入操作都是常数时间的,除了最后一个,它会花费时间在大小加倍上。因为我们进行了n + 1次加入操作,我们可以将数组加倍的时间平摊到所有的加入操作上,因此得到加入操作的平均时间是。它是一个常数。[3]
队列
[编辑]使用Ruby实现的队列,一个先进先出数据结构:
class Queue
def initialize
@input = []
@output = []
end
def enqueue(element)
@input << element
end
def dequeue
if @output.empty?
while @input.any?
@output << @input.pop
end
end
@output.pop
end
end
队列操作及特性参考队列条目,enqeue及deqeue操作时间复杂度为常数, 否则,dequeue需要时间将所有元素从输入数组添加到输出数组中,其中n是输入数组的当前长度。 从输入复制n元素后,我们可以在输出数组再次为空之前执行n出队操作,每次操作都需要一个恒定的时间。 因此,我们可以仅在时间执行一系列n出列操作,这意味着每个出列操作的摊销时间是 。[6]
或者,我们可以收取将任何项目从输入数组复制到输出数组的成本,以及该项目的早期排队操作。 该计费方案将入队的摊还时间加倍,但将出列的摊还时间减少到。
通常用法
[编辑]- 在常见场合,我们把能很好平摊分析的算法称为“平摊算法”。
- 在线算法通常使用平摊分析。
参考资料
[编辑]- ^ 1.0 1.1 Tarjan, Robert Endre. Amortized Computational Complexity (PDF). SIAM Journal on Algebraic and Discrete Methods. April 1985, 6 (2): 306–318 [2024-06-09]. doi:10.1137/0606031. (原始内容存档 (PDF)于2015-02-26).
- ^ 2.0 2.1 Rebecca Fiebrink, Amortized Analysis Explained (PDF), 2007 [2011-05-03], (原始内容 (PDF)存档于20 October 2013)
- ^ 3.0 3.1 3.2 3.3 3.4 Kozen, Dexter. CS 3110 Lecture 20: Amortized Analysis. Cornell University. Spring 2011 [14 March 2015]. (原始内容存档于2018-10-03).
- ^ 4.0 4.1 Suri, Subhash. 130A: Amortized Analysis (PDF). University of California, Santa Barbara. February 17, 2015 [23 April 2025]. (原始内容存档 (PDF)于2021-04-13).
- ^ Klappenecker, Andreas. (PDF). Texas A&M University https://people.engr.tamu.edu/andreas-klappenecker/csce411-s17/csce411-amortized1.pdf. [23 April 2025]. (原始内容存档 (PDF)于2024-04-29). 缺少或
|title=
为空 (帮助) - ^ Grossman, Dan. CSE332:Data Abstractions (PDF). cs.washington.edu. [2015年3月14日]. (原始内容存档 (PDF)于2015年4月2日).
- ^ MIT 6.046J Design and Analysis of Algorithms, Spring 2015. MIT. [2018-10-21]. (原始内容存档于2018-11-25).