怎样利用统计思想来破译密码
在密码发展史上,有过一种“文字替换法密码”。早在古罗马,恺撒大帝就使用过它。
“文字替换法密码”是把一篇文章中的字母按一定规则替换,譬如a换成x,b换成e,……这样一来,这篇文章对敌人来说,就如同天书”一般,难以读懂。
譬如,恺撒采用将每个字母换成它后面的第三个字母的办法来编制密码,即a换成D,b换成E,c换成F,d换成G……列出来如下表所示,
明文 a b c d e f g h i j k l m n o
密文 D EF G H I J K L M N O P Q R
明文 p q r s t u v w x y z
密文 S T U V W X Y Z A B C
这样一来,
Shanghai(明文)
就变成了
VKDQJKDL(密文)
旁人看来当然莫名其妙了。
为了方便地“跳过若干字母”实现替换加密,人们还制成了一个圆盘(如图),只要拨动外盘,就可以找到想跳过几个字母就跳过几个字母的替换对应表。
文宇替换法密码可以用统计思想破译。人们在经过细致的分析和研究之后发现,在一篇文章中,有些字母出现的次数总是特别多,英语中是“e”出现得特别多。也有些字母,出现机会总是特别少,英语中如“z”、“q”等就是出现得特别少的宇母。如果对各个字母进行一下统计,“e”出现的频率可达到13%,“z”与“q”只有0.1%。
下面是密码专家经过统计之后,将英文字母按出现频率大小构成的分组表:
第一组:e;
第二组:t,a,o,i,n,s,h,r;
第三组:d,l,c,u,m,w,f,g,y,p,b;
第四组:v,k,j,x,q,z。
![]() |
不但如此,人们还对两个字母、三个字母连在一起的可能性也作了统计。两个字母连在一起,出现频率最多的10个是:
th,he,in,er,an,re,on,es,st,en。
三个字母连在一起,出现频率最多的10个是:
the,ing,and,ber,are,ent,tha,nth,was,eth。
其中“the”的频率特别高。
知道了这些结果,我们就可以用来破译用“字母替换法”编制的密码了。
在破译时,首先要统计密文中各个字母出现的频率,并按字母出现的频率将字母分组。接下去便可进行分析和推断。分析时,一般总是将密文中出现最多的那个字母推断为是从“e”改过来的,然后慢慢地尝试将全文破译出来。