RSA非对称加密算法浅析

说起加密算法，大的分类上，常规区分通常会区分为对称加密与非对称加密两种，两种算法都各有优缺点。然而互联网发展到今天，应用更广的还是非对称加密的方式，而非对称加密中，RSA又首当其中，被广泛运用到各类应用中。本人作为一个标准的Javer，一直对RSA细节没有深入探究，本文算是对该算法的一个浅析，其中涉及大量的数据公式推导，当遇到大家耳熟能详的数据公式（例如费马定理）时，便不再展开

一、对称加密

关于对称加密，网络的释义很多，有的博主将其定义为“加密和解密使用同一个秘钥就是对称加密”。这样的定义一般值得都是算法透明，密钥不透明的场景，例如加解密双方使用的都是DES算法，在密文传递的同时，密钥也需要传递过去

其实所谓对称加密，即解密是加密的逆运算；比如将一个宝物装进箱子中，然后将其锁上，经过一段路途的运输，收件人收货后，将锁打开，然后将宝物搬出来，流程是这样进行的：

宝物 --> 放入箱子 --> 上锁 -----运输至目的地------ 解锁 --> 箱子中取出 --> 宝物

可见解密是加密的逆运算，我们便可称之为对称加密。应用到程序中，假如我们现在有这样一段文本：

Attack tomorrow morning

我们将每个字符对应的ASCII都统一加一，对应的密文即变为

@Test
public void encrypt() {
    String str = "Attack tomorrow morning";
    char[] chars = str.toCharArray();
    for (int i = 0; i < chars.length; i++) {
        chars[i] = (char) (chars[i] + 1);
    }
    System.out.println(new String(chars));  // 结果为 "Buubdl!upnpsspx!npsojoh"
}

Buubdl!upnpsspx!npsojoh

而将其解密的原理也就显而易见，将值统一减一

@Test
public void decrypt() {
    String str = "Buubdl!upnpsspx!npsojoh";
    char[] chars = str.toCharArray();
    for (int i = 0; i < chars.length; i++) {
        chars[i] = (char) (chars[i] - 1);
    }
    System.out.println(new String(chars));  // 结果为 "Attack tomorrow morning"
}

其实在算法公开的背景下，此处“1”便是密钥，发送方将密文发送的同时，需要将“1”也传送出去，这样接收方便可通过这个“1”对密文进行解密

优点

缺点

算法公开、计算量小、加密速度快、加密效率高

秘钥的管理和分发非常困难，不够安全。上文中，我们的密钥其实就是“1”，但在实际应用的场景中，我们需要将密钥同步给使用方，并且每个用户的密钥都需要保证唯一，且一方的密钥一旦泄露，那么数据肯定也就不安全了，而随着用户的增多，这会使得收、发双方所拥有的钥匙数量巨大，密钥管理成为双方的负担

常见的有对称加密算法有DES、AES、3DES等

二、非对称加密-RSA

非对称加密是相对“对称加密”而言的，拿上文从箱子中取出宝物的例子来说，解密流程可能是将箱子的侧面打开，将宝物取出，亦或是直接将箱子砸碎，反正一定不是加密的逆流程

2.1、加密形式

RSA的密钥有2个

Public Key 即公钥，对外公布的，所有人都可以直接查询到
Private Key 即私钥，只有密钥的提供者拥有，用来将密文解析出明文的关键key

一般是服务的提供者将Public Key公布给所有人，或者索性挂在自己的网站上（证书文件），需要连接该服务的客户端，下载证书并与之建立联系。有同学可能会有疑问，Public Key一样的话，信息如果被其他人截获，岂不造成数据泄露？其实这个担心是多余的，因为只有拥有了私钥才能解密密文，而私钥是只有服务提供者才会拥有的独一份数据

2.2、加密概述

RSA生成公钥、私钥的流程是这样的

参数	说明
p	大质数
q	大质数
n	n = p * q
z	z = φ(n) = (p-1) * (q-1) 欧拉函数
e	要求(e < n)，且与 z 互质
x	要求 (e * x) % z == 1

此时，公钥、私钥也就生成了

公钥 (n, e)
私钥 (n, x)

加密操作（m为明文，c为密文）：

解密操作（m为明文，c为密文）：

举例说明，为了方便计算，我们取较小的n：

参数	计算过程	最终取值
p	-	3
q	-	5
n	n = p * q	15
z	z=φ(n)=(p-1)(q-1)=24=8	8
e	e<n且与z互质，随便取一个小的	7
x	要求 (e * x) % z == 1	15

因此

公钥为：(15, 7)

私钥为：(15, 15)

根据上述信息跑一下单测

@Test
public void en() {
    int p = 3;
    int q = 5;
    int n = p * q;
    int z = (p - 1) * (q -1);
    int e = 7;
    int d = 15;

    int source = 13;
    System.out.println("原明文是： (" + source + ")");
    double pow = Math.pow(source, e);
    long result = (long) Math.abs(pow);
    System.out.println("加密计算的中间值：" + result);
    result = result % n;
    System.out.println("=======================================> 加密后的密文： " + result);

    // 以下开始解密
    double pow2 = Math.pow(result, d);
    long result2 = (long) Math.abs(pow2);
    System.out.println("解密计算的中间值：" + result2);
    result2 = result2 % n;
    System.out.println("=======================================> 解密后的明文： " + result2);
}

原明文是： (13)
加密计算的中间值：62748517
=======================================> 加密后的密文： 7
解密计算的中间值：4747561509943
=======================================> 解密后的明文： 13

我们为13加密，加密后的密文为7，可以成功解密并还原13；但是为了给13加解密，需要计算的代价可见一斑，其中解密的中间值达到了13位数4747561509943

注：这里需要注意一点，明文的长度，一定不能超过n，因为加密的过程是明文阶乘后对n取模，如果长度超过n，那就可能存在多个不同的明文对应一个密文，此时解密算法一定出现问题；另外还有个小细节，即明文、密文的长度是一个量级的，因为它们都是通过对n取模后得到，这样使得破解难度进一步提高

2.3、原理推导

RSA加密虽然名字简单，但是却用到了很多经典的数学定理，接下来我们一步步推导一下

2.3.1、基础定理

设定两个大质数 p、q

n = p * q

因为n比较特殊，它是两个质数的乘积，因此根据欧拉函数，可以很快的计算φ(n)

注：欧拉函数指的是某个整数A，在所有<=A 的整数集合中，与A互质（即两个数除了1之外，没有公因子）的数的数量，比如φ(6) = {1, 5} = 2；

z = φ(n) = (p - 1) * (q - 1)

这里是欧拉函数中的一种情况，如果p、q均为质数，且n = p * q的话，那么φ(n) = (p - 1) * (q - 1)；举例来说，φ(15) = (3 - 1) * (5 - 1) = 2 * 4 = 8；而φ(15) = {1, 2, 4, 7, 8, 11, 13, 14}。正好等于8，与欧拉函数符合。欧拉函数证明略

e 找到一个整数e，满足如下条件

e < n
e 与 z 互质

由于e与z互质，根据贝祖等式，一定可以找到整数x、y，使得如下等式成立

e * x - z * y = 1

其实贝祖等式这里提供的理论支持，也就是任意两个互质的整数，我们都可以找到N多对儿的x、y，使得上述等式成立，举个简单例子，假如 e = 11, z = 10，那么此时(x=1, y=1)，就可以使得等式成立，或者 (x=11, y=12)，即11 * 11 - 10 * 12 = 1，同样使得等式成立

因此由于z = φ(n) = (p - 1) * (q - 1)，所以上述等式可以变形为

e * x = 1 + z * y = 1 + (p - 1) * (q - 1) * y

此时公钥、私钥也就诞生了

公钥：(n, e)
私钥：(n, x)

2.3.2、推导

有上文得知，加解密的公式如下：

将加密公式带入解密公式后，我们其实是得到了这样一个新公式：

接下来就是推导这个等式是否成立了，如果这个公式成立，那么我们也就推导出了RSA

由上2.3.1章节，我们已经推导出 ex = 1 + φ(n)*y，因此上述公式可变形为

进而变形为

因为任何两个数的乘积取模，都等于分别取模后相乘，因此可继续变形

再简单变一下形

这里m是我们需要加密的明文，它的大小远小于n，而n则是两个大质数的乘积，即n=p*q。因此可以保证m^y与n互质，此处就要用到费马-欧拉定理了，即若n，a为正整数，且n，a互质，则: a^φ(n) ≡ 1 (mod n)

因此，上述公式马上就可简化

m为密文，因为我们加密的时候，对明文都是采取分段加密的方式，因此m都是小于n的，所以最终推导出

因此公式得证

2.4、加密实践

"attack 9:00"

我们对上述明文进行加密；因为计算机底层所有的存储都是二进制的，因此将上述明文解析后可以得到一个byte数组，拿到了byte数组也即将其转换为了二进制数字

@Test
public void enBig() {
    BigInteger p = new BigInteger("1125899839733759");
    BigInteger q = new BigInteger("18014398241046527");
    BigInteger n = p.multiply(q);
    BigInteger z = p.subtract(BigInteger.valueOf(1)).multiply(q.subtract(BigInteger.valueOf(1)));
    BigInteger e = z.subtract(BigInteger.valueOf(1));
    BigInteger x = new BigInteger("20282408092494375639463130824708").add(new BigInteger("20282408092494375639463130824707"));

    System.out.println("p = " + p.toString());
    System.out.println("q = " + q.toString());
    System.out.println("n = " + n.toString());
    System.out.println("e = " + e.toString());
    System.out.println("z = " + z.toString());
    System.out.println("x = " + x.toString());

    String str = "attack 9:00";
    byte[] bytes = str.getBytes();
    BigInteger source = new BigInteger(1, bytes);

    System.out.println("原明文字符串是： " + str);
    System.out.println("原明文转换为10进制后的数字为： " + source.toString());

    BigInteger c = source.modPow(e, n);
    System.out.println("=======================================> 加密后的密文： " + c);

    System.out.println("开始解密");
    BigInteger newSource = c.modPow(x, n);
    System.out.println("解密完成");
    String newSourceStr = new String(newSource.toByteArray(), StandardCharsets.UTF_8);
    System.out.println("=======================================> 解密后的10进制数： " + newSource);
    System.out.println("=======================================> 解密后的字符串为： " + newSourceStr);
}

p = 1125899839733759
q = 18014398241046527
n = 20282408092494394779761211604993
e = 20282408092494375639463130824707
z = 20282408092494375639463130824708
x = 40564816184988751278926261649415
原明文字符串是： attack 9:00
原明文转换为10进制后的数字为： 117815745854514889615880240
=======================================> 加密后的密文： 4132881878846003477553871672250
开始解密
解密完成
=======================================> 解密后的10进制数： 117815745854514889615880240
=======================================> 解密后的字符串为： attack 9:00

上文中，我们随便选取了两个相对大的质数

p = 1125899839733759
q = 18014398241046527

其本质是需要保证p*q后的值，大于"attack 9:00"所代表的数字

因为p、q已经指定，那么n、z也就固定了

n = 20282408092494394779761211604993
z = 20282408092494375639463130824708

e需要小于n，且与z互质，简单起见，我们直接通过e = z - 1来选择e

e = z - 1 = 20282408092494375639463130824707

在需要满足等式 e*x - z*y = 1 的前提下，我们随便选取一个x满足等式即可

x = 40564816184988751278926261649415

其实通过JDK所带的KeyPairGenerator来生成RSA的公私密钥对儿时，也是上述的思路，不过生成的n值比较大，常见的有1024、2048、4097位。我们这个例子中的n值，不过也就100位左右，当然位数越多越安全，越难被破解

可见加密的代价是巨大的，一个简单的"attack 9:00"字符串后，是大量的cpu功耗

2.5、为什么难破解

现在我们把自己想象成一个网络黑客，拿2.4举例来说，对外暴露的公钥是

(n=20282408092494394779761211604993, e=20282408092494375639463130824707)

假如我们现在拿到了这样一段密文

密文c = 4132881878846003477553871672250

我们只要进行如下运算就可以获取明文

其中，n我们已经知道了，只需要拿到x就能直接破解，而x是通过公式“e*x - z*y = 1”推导出来的，其中

z = φ(n)
e < n，且与z互质

而e作为公钥中的一个属性，已经完全对外暴露，我们现在只需要知道z(φ(n))的值，再套入公式“e*x - z*y = 1”中便可取得x的值，因为如果e、z、n都已经知道，那么满足这个等式的(x, y)是可穷举的，也就成功破解RSA算法了

因此现在的矛盾直接指向了φ(n)，因为不知道p、q的具体内容，因此直接使用欧拉函数φ(n) = (p-1)(q-1)，但我们知道n，现在需要对其进行因数分解

也就是对 (n=20282408092494394779761211604993) 因数分解

对于这个问题可以先来个简单的，比如：请尝试求φ(77)，我们如果不知道它是由两个质数相乘得到的话，只能从1开始逐一尝试，这个破解难度可想而知。φ(77)={1,2,3,4,5,6,8,9,10,12,13,15,16,17,18,19,20,21,23,24,25,26,27,30,31,32,34,36,37,38,39,40,41,43,45,46,47,48,50,51,52,53,54,58,57,59,60,61,62,64,65,67,68,69,71,72,73,74,75,76}=60，如果知道77=11*7，即2个质数相乘的话，就很容易得到φ(77)=(11-1)*(7-1)=10*6=60

因此事实是，这个工作是灾难性的，迄今为止，没有一个高效的方法对一个大数进行因式分解，只能通过暴力搜索的方式。我们这个例子中，n的值只取了100位，看上去就很难破解了，而实际应用中，通常都是2048位或4096位，短时间内可以说无法破解

posted @ 2023-01-18 12:16 昔久阅读(964) 评论(2) 收藏举报

刷新页面返回顶部