北京小客车摇号程序反编译及算法浅析
北京市摇号网站(bjhjyd.gov.cn)在2014年2月26号第一期摇号后公布了摇号程序及当期摇号数据。由于笔者也是百万摇号大军中的一员,于是第一时间下载了程序,并通过.Net Reflector对程序进行了反编译和简单分析,详情如下:
1.登录北京市摇号网站,下载摇号程序及数据

2.程序文件和数据下载解压后如下图所示,其中CarQuotaNoPickPublic为摇号程序,ICsharpCode.SharpZipLib.dll是.NET常用的解压缩类库。另外一个是
当期的摇号数据包,包含了所有申请人的申请编码和序号。

3.解压数据文件,里面是包含当期所有摇号数据的CSV文件

4.所有人的序号在当前CSV文件中按照申请编码大小依序排列,但所有的编码除了在当前文件中外,并不是按照申请编码的顺序排列的。而申请编码排序的规则并没有披露。


5.摇号程序界面,进过实验,的确可以得出和官方一致的结果(提前剧透,由于摇号程序中使用了Random类,该类返回的是伪随机序列,所以当种子数一定的时候,返回的结果总是一样的)。

6.使用.Net Refector对CarQuotaNoPickPublic.exe进行反编译,可以说代码质量惨不忍睹,不过靠垄断吃饭的行业,要求也不必高。问题在后面
通过分析,发现关键的摇号算法在GetRandomNumber()函数内实现,其中的参数allRandomPickData.seed是当期的种子基数(2014年第一期为026498), allRandomPickData.TotalNumber是当期的摇号总数(2014年第一期为2235804),allRandomPickData.QuotaNumber为可配置的指标总数(2014年第一期为20195)。
通过反编译后的代码可以看到,该摇号算法只是简单的使用了C#中的Random类,通过Random.Next(2235804)方法,从2235804个申请人中抽取20195个编码。
熟悉C#的朋友知道,Random返回的是伪随机数列,当种子数固定的时候,每次返回的序列都是一样的。然而Random.Next其实并不能保证所有申请人的几率一致。正因为此,在RANDOM.ORG的网站上专门实现并提供几率一致的随机算法,但问题还不在此。
该摇号算法是通过申请编码的序号也就是摇号基数进行随机抽取,所以关键在于摇号基数的生成规则和种子基数的选取,缺一不可,否则公布程序可以说毫无意义。而因为算法返回的是伪随机序列,那么完全可以通过人为更改某申请编码的摇号基数或控制种子数的方式来操控摇号结果,在此佩服一下有关人员的聪明机智。公布程序后仍然毫无意义,即响应了政策,又忽悠了大众。关系到首都200万群众切身利益的程序都可以这么粗糙,管中窥豹,可以看出政府信息化中潜藏的问题。本文也是抛砖引玉,希望引起有关部门重视,不要让IT成为政策有效执行的最后一公里。
附件
摇号程序:https://files.cnblogs.com/mullex/%E6%91%87%E5%8F%B7%E7%A8%8B%E5%BA%8F.zip
摇号程序反编译后的源码:https://files.cnblogs.com/mullex/%E6%91%87%E5%8F%B7%E7%A8%8B%E5%BA%8F%E5%8F%8D%E7%BC%96%E8%AF%91%E6%BA%90%E7%A0%81.rar
浙公网安备 33010602011771号