按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
了?”王玲欢喜地递给他一叠稿纸,“你们自己看吧。”郭德福、李大虎、李小虎几人也都凑了上去。稿件虽然已经是经她详细整理过的了,但是外人看起来仍然是觉得特别深奥。
王玲在经过大量的数据对比后,放弃了最初企图通过日文打开突破口的方法,将密电的内容确定为英语内容。英文是世界通用文字,日本使领馆遍设全球,收发电报自然以使用英文字母为便,所以日本的很多电报都是以英文发送的。
她的破译方法是这样的:破译的第一步就是利用语言的频率特征。在各种字母语言中,各个字母的使用次数是不一样的,有的偏高,有的偏低。美国密码学家佛里德曼在调查了大量英文资料后,得出了英文字母的普遍使用频率表1:
字母 频率 字母 频率 字母 频率
A 0。0856 J 0。0013 S 0。0607
B 0。0139 K 0。0042 T 0。1045
C 0。0279 L 0。0339 U 0。0249
D 0。0378 M 0。0249 V 0。0092
E 0。1304 N 0。0707 W 0。0149
F 0。0298 O 0。0797 X 0。0017
G 0。0199 P 0。0199 Y 0。0199
H 0。0528 Q 0。0012 Z 0。0008
I 0。0627 R 0。0677 / /
虽然也有特别的例外,比如1969年法国作家乔治·佩雷克写了一本二百页的小说《逃亡》,其中没有一个含有字母E的单词。而且翻译成英文后,居然也没有一个字母E。这的确算是一个奇迹。由于英文字母中最常见的字母完全没有出现,如果用这本书作为密码底本进行单字母替换加密,破译将会受到很大的阻碍。但是就普遍而言,写出的英语文章各字母的使用频率还是基本上能够与表1里的统计数据相符合的。从中可以看出,英文中E的普遍使用频数最高,相当于在一万个字母中,平均出现一千三百零四次,而Z的使用频数最低,相当于在一万个字母中平均出现八次。另外,从单词的使用频率看,定冠词the的使用频率最高,其次是专有名词和it等代词,还有in和on等前置词的使用频率也很高。从字母在单词中的分布来看,也有一些规律,字母Y总使用频数的百分之九十都集中在单词的结尾,而W的百分之九十都集中在单词的开头,P和C在单词的开头多,在结尾少,R在单词的中间出现较多,J和Q在缩略语以外的单词结尾不会出现,英文中仅有两个单词是由单字母组成的,就是A和I。此外还有很多类似的频率特征。
密码学家们还对日、俄、德、意、系、葡等语言的字母频数和使用频率进行过统计,也得出了类似的使用频率特征,制作出了相应的普遍使用频率表。文人小说下载
下面就是王玲统计出的这份密文中各个字母的频数:
表2
字母 A B C D E F G H I J K L M
频数 55 58 2 41 22 13 87 4 71 70 11 85 8
字母 N O P Q R S T U V W X Y Z
频数 50 14 12 0 12 23 1 2 40 80 8 96 3
这份密文共有八百九十三个字母,因此很容易算出各个字母的使用频率。然后再进行明密比较。
但是,并不是说将密文字母简单地用与其频率相近的英文字母代替就可以的,因为在一般情况下,这些密文字母在密文中的使用频率是不会离开它们所代表的明文字母的频率太远的。从表1中可以看出,明文字母E,T,A,O,N,R,I,S,H可称为高频字母群,D,L,F,C,U,M可称为中频字母群,G,Y,P,W,B,V可称为低频字母群,K,X,J,Q,Z则是罕见字母群。而且从中频字母群到高频字母群,一般都有个明显的频率跳跃,高频字母群中频率最低的字母H为0。0528,中频字母群中频率最高的字母D只有0。0378。这种不同频率字母群之间的突变,在密文字母的频率统计中应该有对应的表现。将密文字母按频数从多到少排列,高频字母群与中频字母群的分界线看来应该在N和D之间:中频字母群与低频字母群的分界线大概是E和O之间,虽然中频字母群应该是六个,而现在只有五个。低频字母群与罕见字母群的分界线大概在M和H之间,虽然低频字母群应该是六个,而现在是七个,于是就得出一个结论:中频字母群里少的一个字母很可能就是低频字母中多的这一个。
表3
Y G L W I J B A N D V U S
96 87 85 80 71 70 58 55 50 41 40 27 23
E O F P R K X M H Z C T Q
22 14 13 12 12 11 8 8 4 3 2 1 0
特别是字母Y,很可能是代表最常用的字母E,密文高频字母群中最低的字母N可能是代表明文字母h。密文中剩下的H,Z,C,T(密文中没有出现字母Q)几个字母很可能就是代表明文中罕见字母群K,X,J,Q,Z,但是具体哪一个代表哪一个还不知道。
现在再利用第二个突破口——语言的连接特征。在英语中,字母Q后面除了连接省略号外,几乎百分之百地连接着字母U,这就是连接特征中的后连接方式。另外,有些字母,它们分别在前面几乎总是连接那么少数几个字母:X前面连接的普遍是I和E,极个别的情况下是O和A。还有一种间断连接方式,在E和E之间R的出现频率最高。
较高频密文字母连接次数分类统计表:
表4
Y96 G87 L85 W80 I71 J70 B58 A55 N50 D41 V40
1Y1 7Y3 1Y7 7Y9 0Y2 4Y10 3Y10 10Y7 23Y1 8Y9 4Y14
3G7 0G0 8G2 15G9 3G9 5G17 7G8 10G12 6G0 2G1 3G7
7L1 2L8 1L1 13L6 3L2 11L20 1L6 4L10 16L1 3L10 4L4
9W7 9W15 6W13 2W2 4W9 5W0 12W5 3W0 0W21 8W1 6W3
2I0 9I3 2I3 9I4 1I1 9I15 6I3 2I3 2I1 2I8 10I2
10J4 17J5 20J11 0J5 15J9 3J3 1J7 0J1 0J0 0J0 0J7
11B3 8B7 6B1 5B12 3B6 7B1 6B6 2B0 0B10 4B0 1B1
7A10 12A10 10A4 0A3 3A2 1A0 0A2 15A15 0A0 0A0 0A2
1N23 0N6 1N16 21N 1N2 0N0 10N 0N0 0N0 1N0 10N2
9D8 1D2 10D3 1D8 8D2 0D0 0D4 0D0 0D1 1D1 1D1
14V4 7V3 4V4 3V6 2V10 7V0 1V1 2V0 2V10 1V1 1V1
4U2 5U6 3U5 0U6 11U3 1U0 2U1 0U2 0U0 1U1 0U0
5S4 0S6 2S2 1S0 7S1 0S0 1S0 0S1 0S0 3S0 0S0
8E7 2E2 3E3 0E4 0E0 9E1 1E2 1E1 0E0 1E0 0E0
1O6 2O0 0O0 3O0 1O0 0O0 2O0 2O1 0O0 0O2 0O0
1F0 0F0 2F1 0F2 5F1 0F6 1F2 0F2 2F0 0F4 1F0
0P3 3P0 1P2 0P0 0P0 8P0 0P0 0P0 0P6 0P0 0P0
0R0 1R2 1R1 0R2 0R4 1R0 0R1 1R0 0R0 5R1 0R1
1K8 3K0 3K0 0K0 1K1 1K0 0K0 0K0 0K0 0K0 0K0
1X2 1X2 1X1 0X1 1X4 0X0 4X0 3X3 0X0 0X1 0X0
2M0 1M4 0M2 0M0 01M 0M0 0M0 1M0 0M1 0M0 0M1
0H1 1H0 0H1 0H0 0H1 0H0 0H1 1H0 0H0 0H0 1H0
0Z2 0Z0 0Z0 0Z0 1Z1 0Z0 0Z0 0Z0 0Z0 0Z0 0Z0
0C0 0C2 0C0 0C0 0C0 0C0 0C0 0C0 0C0 0C0 0C0
0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0
在第一列中(Y96)中,G前面是数字3,表示字母Y在字母G前面出现三次,即字母对YG在密文中出现三次。G后面是数字4,表示字母对GY在密文中出现四次。
从表中数据可以看出,密文字母Y不但频数最大,而且与许多不同的字母连接,已经可以确定Y就是代表的明文字母e。
明文中频率特别高的是E,T,A三个字母,是密文中频率特别高的Y,G,L,W四个字母。假设这三个明文高频字母的代替字母就在这四个当中,已知Y代表E,那么T和A就在G,L,T当中。在高频字母中,元音字母经常出现在大多数字母的前后,而辅音字母则会避开大多数字母。就如字母E可以与任何一个字母组合,而字母J却很少会出现在字母B,D,G,J,K,M,Q,V的两边。从表4中可以看出G,L,T这三个字母的连接特征来,W与其他字母的连接特别少,因此可以得出字母W就是代表辅音字母T。则G和L中的一个则代表A。再加上前面得出的N可能代表的是H,就可以知道WNY代表的是单词the。
另外,明文中的三个高频原音字母A,I,O在连接上的特征是:它们与其他字母的连接总数相对较大,但是自己相互间却总是避免相连。观察统计表4,由于字母Y和W已经被推断出来,于是选择具备这些特征的排列在最前面的G,L,I三个字母来假定为A,I,O。但具体是哪一个代表哪一个还不知道。于是又根据明文中io的频率比较高,而oi,ia,ai,oa,ao的频率则很低的现象来确定。统计表4给出了密文中相应字母对出现的频数,GL2次,LG8次,GI9次,IG3次,LI2次,IL3次,因此可以假定出现九次的GI=io,于是L=A。
明文辅音字母中最具特征的是字母N,因为它的前连接字母有五分之四是元音字母,字母连接统计表4表中,在密文字母J的前面,较多地连接有字母Y,G,I,L,七十三次中占有六十二次,于是得出J表N。
有些字母的推论有很多不同的方法,通过不同的方法来验证就更能确定推论结果的准确性。比如对于已经大概知道了的N(代表H)W(代表T),就可以用另外的方法来验证。在连接统计表4中,N的特点也很明显,它总是连接在Y(已经确定为E)的前面,达二十三次,而在它后面却只出现了一次,这个特点与明文字母H的特点正好相同,he是英文最常见的字母对之一,而eh则十分罕见,这也能证明N很可能是代表字母H。另外在表4当中,N在W后面多达二十一次,而从未在它后面出现过,明文中th也是最常见的字母对,而ht却十分罕见,则密文字母W就很可能是代表T。还有一个方法可以进一步验证,明文字母H正好同N相反,它居于元音字母之前的次数大约是跟在它们后面的十倍。在连接统计表4中,可以看出密文字母N在Y,G,I,L之前的次数为三十七次,而在后面的次数为三次。通过这几方面的验证,基本上可以肯定N代表H,W代表T。
当然,密码的破译虽然要用到数学方面的知识,但是毕竟不可能像做数学题那样每一个步骤都是可以证明的。更多的是需要假设,还需要运气,比如在划定出大概的某些字母代表某些字母后,你就可以假设某一个字母代表某一个字母,在不断假设的情况下,将已知的字母代替到密文当中,这样一步一步推论下去,如果运气好,有可能每一步都很顺利地走对了,一旦出错,又得从头再来。好比学生做四选一的选择题,根据已经掌握的知识只能排除其中两个选项时,剩下的就只能依靠运气在另外的两个选项里选择一个,但是选择错了就算失败了。而幸运的是此类密码破译的这一环节在选择后,在继续的工作中如果发现错了,再返回来重新选择就成功了。
现在将已经识别的字母全部代入密文,代入的结果如下表: