陳雨涵提示您:看後求收藏(八零中文www.80zw.tw),接著再看更方便。
雖然也有特別的例外,比如1969年法國作家喬治&iddot;佩雷克寫了一本二百頁的小說《逃亡》,其中沒有一個含有字母e的單詞。而且翻譯成英文後,居然也沒有一個字母e。這的確算是一個奇蹟。由於英文字母中最常見的字母完全沒有出現,如果用這本書作為密碼底本進行單字母替換加密,破譯將會受到很大的阻礙。但是就普遍而言,寫出的英語文章各字母的使用頻率還是基本上能夠與表1裡的統計資料相符合的。從中可以看出,英文中e的普遍使用頻數最高,相當於在一萬個字母中,平均出現一千三百零四次,而z的使用頻數最低,相當於在一萬個字母中平均出現八次。另外,從單詞的使用頻率看,定冠詞the的使用頻率最高,其次是專有名詞和it等代詞,還有和on等前置詞的使用頻率也很高。從字母在單詞中的分佈來看,也有一些規律,字母y總使用頻數的百分之九十都集中在單詞的結尾,而w的百分之九十都集中在單詞的開頭,p和c在單詞的開頭多,在結尾少,r在單詞的中間出現較多,j和q在縮略語以外的單詞結尾不會出現,英文中僅有兩個單詞是由單字母組成的,就是a和i。此外還有很多類似的頻率特徵。
密碼學家們還對日、俄、德、意、系、葡等語言的字母頻數和使用頻率進行過統計,也得出了類似的使用頻率特徵,製作出了相應的普遍使用頻率表。
下面就是王玲統計出的這份密文中各個字母的頻數:
表2
字母 a b c d e f g h i j k l
頻數 55 58 2 41 22 13 87 4 71 70 11 85 8
字母 n o p q r s t u v w x y z
頻數 50 14 12 0 12 23 1 2 40 80 8 96 3
這份密文共有八百九十三個字母,因此很容易算出各個字母的使用頻率。然後再進行明密比較。
但是,並不是說將密文字母簡單地用與其頻率相近的英文字母代替就可以的,因為在一般情況下,這些密文字母在密文中的使用頻率是不會離開它們所代表的明文字母的頻率太遠的。從表1中可以看出,明文字母e,t,a,o,n,r,i,s,h可稱為高頻字母群,d,l,f,c,u,可稱為中頻字母群,g,y,p,w,b,v可稱為低頻字母群,k,x,j,q,z則是罕見字母群。而且從中頻字母群到高頻字母群,一般都有個明顯的頻率跳躍,高頻字母群中頻率最低的字母h為00528,中頻字母群中頻率最高的字母d只有00378。這種不同頻率字母群之間的突變,在密文字母的頻率統計中應該有對應的表現。將密文字母按頻數從多到少排列,高頻字母群與中頻字母群的分界線看來應該在n和d之間:中頻字母群與低頻字母群的分界線大概是e和o之間,雖然中頻字母群應該是六個,而現在只有五個。低頻字母群與罕見字母群的分界線大概在和h之間,雖然低頻字母群應該是六個,而現在是七個,於是就得出一個結論:中頻字母群裡少的一個字母很可能就是低頻字母中多的這一個。
表3
y g l w i j b a n d v u s
96 87 85 80 71 70 58 55 50 41 40 27 23
e o f p r k x h z c t q
22 14 13 12 12 11 8 8 4 3 2 1 0
特別是字母y,很可能是代表最常用的字母e,密文高頻字母群中最低的字母n可能是代表明文字母h。密文中剩下的h,z,c,t(密文中沒有出現字母q)幾個字母很可能就