数的算法

基本算数

一个整数可以用物体的个数来表示。比如用8个点我们就能表示数字8。但这样的话对于大的数字我们就必须用非常多的点，造成了不方便。因此为了更方便地表示一个数，我们通常要选择一个进制。我们在日常生活中常用的是10进制，在计算机中常用的是2进制，等等。

数\(N\)在\(a\)进制下需要\(\log_a N\)位，在\(b\)进制下需要\(\log_b N\)，二者的比值\(\log_b^a\)是常数。因此我们可以认为，对进制的选择是不影响算法的时间复杂度的。

加法

从我们在小学时做的列竖式计算中就可以看出，逐位计算并进位的复杂度是正比于数的位数的。设数的位数为\(n\)，则复杂度是\(O(n)\)。同时，仅仅读入数据就要消耗\(O(n)\)，因此这就是加法的最优复杂度了。

乘法

按照列竖式的方法，乘法的复杂度是\(O(n^2)\)。

我们也可以通过这样的递归方法来完成乘法：

\(x \cdot y=\left\{\begin{array}{ll} 2(x \cdot\lfloor y / 2\rfloor) & \text { if } y \text { is even } \\ x+2(x \cdot\lfloor y / 2\rfloor) & \text { if } y \text { is odd } \end{array}\right.\)

递归次数正比于\(y\)的位数\(n\)，每次完成加法的复杂度也是\(n\)，总的复杂度依然是\(O(n^2)\)。

乘法本质上是多项式乘法，通过快速傅里叶变换是可以优化到\(O(n \log n)\)的。我们在讨论“分治”算法时还会来讨论这个问题。

除法

我们想算出\(x\)除以\(y\)的商\(q\)和余数\(r\)。考虑递归，假设已经算出了\(\lfloor x/2\rfloor\)除以\(y\)的余数\(q'\)和\(r'\)。则有\(\lfloor x/2 \rfloor=q' \cdot y + r'\)。两边同时乘以2，得到\(2\lfloor x/2 \rfloor=2q' \cdot y + 2r'\)。如果\(x\)是偶数，那么有\(x=2q' \cdot y + 2r'\)，否则有\(x = 2q' \cdot y + 2r'+1\)。注意如果\(2r'\)或\(2r'+1\)超出了\(y\)，要减一个\(y\)。这样就推出了\(q,r\)。

递归的次数为\(n\)，减\(y\)的复杂度为\(n\)，总复杂度是\(O(n^2)\)。

模运算

对于\(x\)除以\(N\)的商为\(q\)，余数为\(r\)，可以写出\(x = qN+r\)，其中\(r\)被限制在\(\{0,\cdots,N-1\}\)内。如果对于\(y\)也有\(y=q'N+r\)，那么就称\(x\)和\(y\)是同余的。记作

\(x \equiv y \pmod N\)

由此可见\(x-y\)一定是\(N\)的倍数，即\(x-y \equiv 0 \pmod N\)。

如果\(x \equiv x' \pmod N\)，同时\(y \equiv y' \pmod N\)。那么此时有\(x-x' = sN\), \(y-y' = tN\)。那么有\(x+y=(s+t)N+x'+y'\)，所以\(x+y \equiv x'+y' \pmod N\)。而\(xy = (x'+sN)(y'+tN) = x'y'+(tx'+sy'+stN)N\)，所以\(xy \equiv x'y' \pmod N\)。这告诉我们，在模运算中加法和乘法是可以被同余的项代换的。

模运算中由于每个数都被限制在\(\{0,\cdots,N-1\}\)内，因此加法不会超过\(2N-2\)，因此加法以后最多只需要减一次\(N\)就能保证模运算的范围。两数相乘不会超过\((N-1)^2\)，因此需要做一次除法（区域）才能保证范围，但我们注意到数字的位数最多只会扩展一倍。

注意，在模运算下两个都不为0的数相乘可能得到0。比如5*5在模25意义下为0。

快速幂

在模意义下计算\(x^y\)要用到快速幂算法。核心是：

\(x^{y}=\left\{\begin{array}{ll} \left(x^{2}\right)^{\lfloor y / 2\rfloor} & \text { if } y \text { is even } \\ x \cdot\left(x^{2}\right)^{\lfloor y / 2\rfloor} & \text { if } y \text { is odd } \end{array}\right.\)

递归的次数是\(n\)，每次乘法用去\(n^2\)，复杂度为\(O(n^3)\).

欧几里得算法(GCD)

对于\(x \geq y\)，有\(gcd(x,y)=gcd(x\mod y,y)\)。一直这样递归下去，直到\(x\)成为\(y\)的倍数为止，我们就求出了最大公约数。这称为求解最大公约数的辗转相除法。要证明这个关系，只需证明辗转相减法\(gcd(x,y)=gcd(x-y,y)\)，因为模运算只是减法运算的一种“捷径”。这是自然的，因为\(x,y\)都可以看作是由它们的公约数这个基本积木拼成的，它们的差依然是由同样的基本积木组成的。严格地，设\(x,y\)有一个公约数为\(k\)，那么有\(x = s \cdot k\)，\(y = t \cdot k\)。于是\(x-y = (s-t) \cdot k\)。因此\(x,y\)的任意一个公约数一定也是\(x-y,y\)的一个公约数。所以一定有\(gcd(x,y) \leq gcd(x-y,y)\)。反之同理，\(x-y,y\)的任意一个公约数一定也是\(x,y\)的一个公约数，所以又有\(gcd(x-y,y) \leq gcd(x,y)\)。联立即得\(gcd(x,y)=gcd(x-y,y)\)。这样我们就证明了辗转相除法。

为了分析辗转相除法的复杂度，我们来估计一下\(x \mod y\)的大小。如果\(y \leq x/2\)，那么\(x \mod y < y \leq x/2\)；如果\(y>x/2\)，那么\(x \mod y = x-y < x/2\)。因此我们每一次至少把一个数缩小了一半，递归的次数是\(O(n)\)的。而模运算的计算复杂度就是除法的复杂度\(O(n^2)\)，因此总的复杂度是\(O(n^3)\)。

扩展欧几里得算法(EXGCD)

对于方程\(ax+by=d\)，左边可以提取出\(a,b\)的最大公约数，因此\(d\)一定是\(gcd(a,b)\)的倍数。换句话说，\(ax+by\)构成的集合一定是“量子化”的，\(gcd(a,b)\)是最小的单位。如果\(d\)不是\(gcd(a,b)\)的倍数，那么方程一定是无解的。

而我们要说明，\(ax+by=gcd(a,b)\)一定是有解的。由欧几里得算法得，\(gcd(a,b)=gcd(b,a \mod b)\)。我们列一个新的方程\(bx'+(a\mod b)y'=gcd(b,a \mod b)\)。联立可得\(ax+by=bx'+(a\mod b)y'\)。注意到\(a \mod b = a-b\lfloor a/b \rfloor\)。因此有\(ax+by=ay'+b(x'-\lfloor a/b \rfloor y')\)。假设我们已经递归地解得了\(x',y'\)，就可知\(x=y',y=x'-\lfloor a/b\rfloor y'\)是一组可行的解。而由于\(gcd(a,b)\)递归的尽头\(b=0\)，此时\(x\)一定有解，因此返回去最初的\(x,y\)一定有解。这样求解方程的方法就成为扩展欧几里得算法。

我们通过Exgcd已经求出了\((x_0,y_0)\)是\(ax+by=gcd(a,b)\)的一组解，如何用它去找到方程的所有可行解呢？如果\(a(x_0+p)+b(y_0+q)=gcd(a,b)\)也是一组解，那么必须满足\(ap+bq=0\)（很像线性代数中的零空间的解）。反过来，所有满足\(ap+bq=0\)的\(p,q\)一定能够保证\((x+p,y+q)\)还是方程的解。因此我们只需解出\(ap+bq=0\)的所有可行解\((p,q)\)即可。设\(a,b\)除掉彼此的最大公约数得到\(a',b'\)，\(ap+bq=0\)当且仅当\(a'p+b'q=0\)。要使得\(a'p\)是\(b'\)的倍数，\(a'p\)必须是\(lcm(a',b')\)的倍数，而\(gcd(a',b')=1\)，所以\(lcm(a',b')=a'b'\)，\(a'p\)必须是\(a'b'\)的倍数，即\(p\)必须是\(b'\)的倍数，因此必须满足\(p=\dfrac{kb}{gcd(a,b)}\)。而容易验证所有这样的\(p\)都是满足的。综上，\(ax+by=gcd(a,b)\)的全部解就是\((x_0+\dfrac{kb}{gcd(a,b)},y_0-\dfrac{ka}{gcd(a,b)})\)。

对于一般的\(ax+by=d\)，我们可以解出\(ax+by=gcd(a,b)\)，再把得到的解乘上\(\dfrac{d}{gcd(a,b)}\)倍，得到一组可行的解\((x_0,y_0)\)。而后，完全相同的，我们依然利用\(ap+bq=0\)把特解拓展到通解，这个过程中只用到了关于\(a,b\)的性质，与等式右侧是无关的，因为我们所作的修正是完全相同的。得到的通解依然是\((x_0+\dfrac{kb}{gcd(a,b)},y_0-\dfrac{ka}{gcd(a,b)})\)。

乘法逆元

我们想要定义模运算下的除法，本质上就是定义模运算下的倒数。如果\(ax \equiv 1 \pmod N\)，就称\(x\)是\(a\)在模\(N\)意义下的乘法逆元（其中\(a,x\)都在\(0\)到\(N-1\)之间）。

并不是所有\(a\)都有乘法逆元的。比如\(a=0\)就找不到这样的\(x\)；如果\(a=2,N=6\)，也可以验证没有任何的\(x\)是满足的。由扩展欧几里得，我们发现乘法逆元存在当且仅当\(gcd(a,N)=1\)：如果\(ax \equiv 1\pmod N\)有解，则\(ax+Ny=1\)有解，这要求\(gcd(a,N)=1\)。而只要\(gcd(a,N)=1\)满足，由EXGCD就可以给出\(ax+Ny=1\)的一组解。这样得到的解可能会使得\(x\)没有落在\(0\)到\(N-1\)内，但根据通解的表达式，\(x\)只能间隔\(\dfrac{N}{gcd(a,N)}=N\)地变化。所以我们把\(x\)加上若干个\(N\)使它落在\(0\)到\(N-1\)就可以了，这一定是能够做到的。

对于给定的\(a\)，逆元\(x\)是唯一的。因为如果存在\(x' \neq x\)使得\(x'\)也是\(a\)的乘法逆元，那么就有\(ax \equiv ax' \equiv 1 \pmod N\)。于是\(a(x-x')=tN\)。由于\(gcd(a,N)=1\)，所以\(a(x-x')\)一定是\(a,N\)的最小公倍数的倍数，即\(a(x-x')=kaN\)，于是\(x-x'=kN\)，这与\(0 \leq x,x'<N\)矛盾。

素数

费马小定理

费马小定理指出：如果\(p\)是素数，那么对任意满足\(1 \leq a < p\)的整数\(a\)，一定有\(a^{p-1} \equiv 1 \pmod p\)

我们发现，对于\(i=1,\cdots,p-1\)，\(a \cdot i\)一定是两两不同且不为0的（刚好构成了一个permutation）：首先，如果\(a \cdot i \equiv 0\pmod p\)，根据\(gcd(a,p)=1\)，\(a\)存在乘法逆元，两边同时乘上\(a\)的乘法逆元，就会得到\(i \equiv 0\)，矛盾；如果对于\(i \neq j\)成立\(a \cdot i \equiv a \cdot j\)，那么同样乘以乘法逆元会得到\(i \equiv j\)，矛盾。因此，\(a \cdot i\)刚好取遍了\(1,\cdots,p-1\)。把他们全都乘起来，就得到\(a^{p-1}!(p-1)! \equiv (p-1)! \pmod p\)。而\(1\)到\(p-1\)的每个数都没有\(p\)这个质因子，因此\((p-1)!\)一定是与\(p\)互质的，因此也有乘法逆元。于是两边同时乘以这个逆元，得到\(a^{p-1} \equiv 1 \pmod p\)。这样就证明了费马小定理。

遗憾的是，费马小定理的逆命题并不成立——我们不能由\(a^{N-1} \equiv 1 \pmod N\)推出\(N\)是素数。反例：合数\(341=11\times 31\)，却有\(2^{340} \equiv 1 \pmod {341}\)。甚至存在这样的合数\(N\)，使得所有比\(N\)小的与它互质的数\(a\)全都满足\(a^{N-1} \equiv 1 \pmod N\)。（\(N=561=3\times 11 \times 17\)）这样的数被称为Carmichael数。

\(a^{N-1} \equiv 1 \pmod N\)虽然无法推出\(N\)是素数，但可以推出\(gcd(a,N)=1\)。如果\(gcd(a,N)>1\)，那么\(a^{N-1}-tN\)一定是\(gcd(a,N)\)的倍数，因此永远不可能等于1。

根据费马小定理，我们又得到了另一种求乘法逆元的方式：\(p\)是素数时，\(a\)在模\(p\)下的逆就是\(a^{p-2} \mod p\)。

素数判断

我们可以证明，如果\(N\)不是Carmichael数，即存在\(a\)（与\(N\)互质）使得\(a^{N-1} \not\equiv 1 \pmod N\)，那么这样的\(a\)在\(1\)到\(N-1\)间至少有一半。我们先任意固定这样的一个\(a\)，它是一个常数，满足\(N-1\)方不为1。假如我们能找到一个\(b\)满足\(b^{N-1} \equiv 1 \pmod{N}\)，那么对于\(ab\)（模意义下）有\((ab)^{N-1} \equiv a^{N-1}b^{N-1} \equiv a^{N-1} \not\equiv 1 \pmod {N}\)。因为\(a\)与\(N\)互质，所以有乘法逆元，所以对于某个\(b'\)满足\(b \not\equiv b' \pmod{N}\)，一定成立\(ab \not\equiv ab' \pmod N\)。因此对于每个这样的\(b\)，我们一定可以对应地找到一个\(ab\)。前者满足\(N-1\)次方等于1的条件，后者满足不等于\(N-1\)次方等于1的条件。由于\(b^{N-1} \equiv 1 \pmod{N}\)成立，\(b\)一定存在乘法逆元，而显然\(a \not \equiv 1 \pmod N\)，所以\(b \not\equiv ab \pmod N\)一定成立。我们一对对选这样的\(b,ab\)，会形成两个独立的集合，一个全都是\(N-1\)次方等于1的，一个全都是\(N-1\)次方不等于1的。也就意味着，每找到一个等于1的就一定能找到一个不等于1的，所以不等于1的至少占了一半。

所以我们可以设计这样一个素数判定算法，对任意给定的\(N\)，我们在\(2\)到\(N-1\)间随机一个\(a\)，计算\(a^{N-1} \mod N\)。如果答案为1就返回yes否则返回no。如果\(N\)是素数，那么程序一定正确；如果\(N\)不是素数且\(N\)不是Carmichael数，此时返回yes的概率小于\(1/2\)。也就是说此时程序出错的概率小于\(1/2\)。如果我们连着做\(k\)次，出错的概率就被降到了\(1/2^k\)。

由于Carmichael数是罕见的，我们直接忽略这种情况。这样我们就有了一个高效的算法，复杂度就是计算快速幂的复杂度\(O(n^3)\)。考虑到\(k\)后的复杂度为\(O(kn^3)\)。

素数生成

Lagrange指出\(N\)以内的素数个数同阶于\(\dfrac{N}{\ln N}\)。这说明素数是非常密集的。我们可以不停地随机一个\(N\)以内的数，然后用上面的算法判定它是否是一个素数，直到它通过判定为止。这样我们就大概率能得到一个素数了。

每个随机到的数是素数的概率为\(\dfrac{1}{\ln N}\)，因此期望\(\ln N\)次随机后算法结束，共\(O(n)\)次。每次判定的复杂度是\(O(n^3)\)。因此总复杂度为\(O(n^4)\)。

密码学

一切发送出去的（通信、电波……）信息都是可能被监听的。想要达成加密的目的就必须有从未发送出去过的“密钥”。如果Alice和Bob都有一个二进制串\(r\)（密钥），那么Alice可以先把要发送的串与\(r\)异或，Bob收到后再与\(r\)异或一次就能得到明文了。但这要求\(r\)很长，而且两人要在不被窃听的情况下交换\(r\)是不容易的。

RSA

RSA是公钥加密的典范。在这里，Bob手上有两个密钥，一个密钥全世界只有他知道，称为私钥；一个密钥向全世界公开，称为公钥。Alice用公钥加密自己的信息，Bob利用私钥解密，这样就永远都不可能有人破解了。

在这里，Bob随机生成两个质数\(p,q\)。定义\(N=pq\)，再任意找一个与\((p-1)(q-1)\)互质的数\(e\)（这是容易办到的，比如取\(e=3\)）。\(N,e\)构成了我们的公钥。求出\(e\)在模\((p-1)(q-1)\)意义下的乘法逆元\(d\)，把\(d\)作为我们的私钥。

由于\(ed \equiv 1 \pmod{(p-1)(q-1)}\)，可以写出\(ed = k(p-1)(q-1)+1\)。而\(x^{p-1} \equiv 1\pmod p\)，因此\(x^{ed}\equiv x^{k(p-1)(q-1)+1} \equiv x \cdot (x^{p-1})^{k(q-1)} \equiv x \pmod p\)。同理，也有\(x^{ed} \equiv x \pmod q\)。因此\(x^{ed}-x=t_1p=t_2q\)。说明\(x^{ed}-x\)是\(p,q\)的公倍数，因此有\(x^{ed} \equiv x \pmod{pq}\)，即\((x^{e})^d \equiv x \pmod N\)。这个式子对于任意的\(0\)到\(N-1\)的\(x\)都成立，如果把\(f(x)=x^e\)看作一个映射，\(g(x)=x^d\)看作一个映射，那么\(g(f(x))=x\)。这说明\(g(x)\)的象集至少有\(N\)个元素，那么其定义域也至少要有\(N\)个元素。而\(x\)最多只有\(N\)个元素。因此\(f,g\)都必须是双射。所以对于任意的\(x\)，我们都可以用\(f\)加密（它依赖于\(e,N\)，因此是公钥加密），接收者都可以用\(g\)来解密（由于涉及到\(d\)，因此是私钥解密）。

RSA的核心在于，作为公钥外人只知道\(N\)而不知道\(p,q\)。在\(N\)很大时是难以找出\(p,q\)的。因此也就难以找出\((p-1)(q-1)\)，也就难以求出逆元\(d\)。我们把要发送的信息以\(x^e\)的方式加密，不知道\(d\)就无法解密，只有Bob能够解密。

posted @ 2023-02-23 22:35 行而上阅读(270) 评论(0) 收藏举报

刷新页面返回顶部

行而上

To The Things Themselves