Quick Pow: 如何快速求幂

今天讲个有趣的算法：如何快速求 \(n^m\)，其中 n 和 m 都是整数。

为方便起见，此处假设 m >= 0，对于 m < 0 的情况，求出 \(n^{|m|}\) 后再取倒数即可。

另外此处暂不考虑结果越界的情况（超过 int64 范围）。

当然不能用编程语言的内置函数，我们只能用加减乘除来实现。

n 的 m 次方的数学含义是：m 个 n 相乘：n*n*n...*n，也就是说最简单的方式是执行 m 次乘法。

直接用乘法实现的问题是性能不高，其时间复杂度是 O(m)，比如 \(3^{29}\) 要执行 29 次乘法，而乘法运算是相对比较重的，我们看看能否采用什么方法将时间复杂度降低。

设 m = x + y + z（x、y、z 都是整数），我们知道有如下数学等式： \(n^m\) = \(n^{x+y+z}\) = \(n^x * n^y * n^z\)。

也就是说，如果我们已经知道 \(n^x\)、\(n^y\)、\(n^z\) 的值，是不是就可以直接用他们相乘得出 \(n^m\)的结果？这样的话乘的次数就大大降低了。

于是问题就变成应该将 m 拆成怎样的几个数的和。

因为计算机是玩二进制的，我们尝试着将这些数跟 2 扯上联系（以 2 为底），看看会不会有奇迹发生。

我们看看具体的例子：\(3^{29}\)。

我们将 29 做这样的拆分：29 = 16 + 8 + 4 + 1。

这个拆分有什么特点呢？右边的数都是 2 的 X 次方（\(2^4 + 2^3 + 2^2 + 2^0\)）。

我们把上面的拆分带进公式：\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\)。

那我们能不能知道 \(3^{16}\)、\(3^{8}\)、\(3^{4}\)、\(3^{1}\) 是什么呢？

我们不用计算就知道 \(3^{1}\) 是什么——但仅此而已。

不过我们可以用 \(3^{1}\) 自乘 4 次的到 \(3^4\)；然后再用 \(3^4\) 自乘得到 \(3^8\)；再通过 \(3^8\) 自乘得到 \(3^{16}\)。

好像有点感觉了——我们每做一次乘法，就能将结果翻倍（如 \(3^4\) 自乘就变成 \(3^4*3^4 = 3^8\)）。

如此，虽然也要多次乘法，但乘的次数从 29 次降到 9 次！

然后我们再回头看看上面的拆分：

29 = 16 + 8 + 4 + 1 = \(2^4 + 2^3 + 2^2 + 2^0\) = \(1*2^4 + 1*2^3 + 1*2^2 + 0*2^1 + 1*2^0\) 。

这不就是学校学的二进制转十进制吗（29 的二进制是 11101）？

\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\) 是说：取 29 的二进制表示中所有值是 1 的位，算出它们的指数值并相乘就得到最终的值。

我们用 go 语言实现一下：

// 求 a 的 n 次方
// a、n 是非负整数
func Pow(a,n int64) int64 {
	// 0 的任何次方都是 0
	if a == 0 {
		return 0
	}
	
	// 任何数的 0 次方都是 1
	if n == 0 {
		return 1
	}

	// 1 次方是它自身
	if n == 1 {
		return a
	}

	// 用滚雪球的方式计算幂
	// 雪球初始值是 1
	var result int64 = 1
	// 滚动因子初始化为 a 的 1 次方（a 自身）
	factor := a
	// 循环处理直到 n 变成 0（所有的二进制位都处理完了）
	for n != 0 {
		// 跟 1 做与运算，判断当前要处理的位是不是 1
		// 之所以是直接跟 1 做与运算，因为后面每处理一轮都将 n 右移了一位，保证每次要处理的位都在最低位
		if n & 1 != 0 {
			// 当前位是 1，需要乘进去
			result *= factor
		}
		// 每轮结束时将滚动因子自乘
		// 因为每行进一轮，指数都翻倍，整体结果就是自乘
		// 比如本轮因子是 2**4，下一轮就是 2**8
		// 2**8 = 2**(4+4) = 2**4 * 2**4
		// （** 表示指数）
		factor *= factor
		// n 右移一位，将下一轮要处理的位放在最低位
		n = n >> 1
	}
	
	return result
}

有什么用呢？

很多语言内置的 pow 函数都只接受浮点数，浮点数的运算是非常重的，如果我们的程序需要频繁计算整数的幂，就可以采用 quick pow 算法代替语言内置的幂函数以提升性能。

我们对 go 语言内置的 math.Pow 和 quick pow 算法做个性能测试对比一下。

// 测试 3 的 29 次方的性能测试
var benchPowB int64 = 3
var benchPowP int64 = 29

// 上面的 quick pow 算法
func BenchmarkQuickPow(b *testing.B)  {
	for i := 0; i < b.N; i++ {
		algo.Pow(benchPowB, benchPowP)
	}
}

// go 语言 math 包的 Pow 方法，只接受 float64 类型
func BenchmarkInnerPow(b *testing.B)  {
	x := float64(benchPowB)
	y := float64(benchPowP)
	for i := 0; i < b.N; i++ {
		math.Pow(x, y)
	}
}

// 用简单乘法实现（3 自乘 29 次）
func BenchmarkSimpleMulti(b *testing.B) {
	for i := 0; i < b.N; i++ {
		var r int64 = 1
		var j int64 = 0
		for ; j < benchPowP; j++ {
			r *= benchPowB
		}
	}
}

测试结果：

goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
BenchmarkQuickPow-8           357897716                3.373 ns/op
BenchmarkInnerPow-8           39162492                29.30 ns/op
BenchmarkSimpleMulti-8          121066731                9.549 ns/op
PASS
ok      command-line-arguments  4.894s

从性能测试结果看，quick pow 算法比简单乘法快了好几倍，比 math.pow 快了近 10 倍。

所以，如果程序只需要求整数幂，而且能确保计算结果不会越界时，可以考虑使用 quick pow 算法代替语言内置的浮点函数。

posted @ 2022-06-29 23:50 林子er 阅读(847) 评论(0) 收藏举报

刷新页面返回顶部

林子er

用硬核且生趣的方式讲计算机、编程、互联网通识和历史

Quick Pow: 如何快速求幂

有什么用呢？

公告