美文网首页
当密码学遇上统计学

当密码学遇上统计学

作者: leengsmile | 来源:发表于2015-11-23 12:19 被阅读325次

标题取的很大,主要是为了将文章上升到科学的层次,而不仅仅是某一项具体的应用。

本文简述卡方统计量的思想,及其在Caesar加密破解中的应用。

Caesar 加密,将每个字母用其在字母表之后的某个位置的字母代替,比如用d代替ae代替bf代替c,对于z,用c代替。1 如果将a, b, c, ..., z 从0开始编号,这种替换的过程,可以看成是字母的循环右移(或者左移)。在古典加密中,这个位置参数是保密的,如果被第三方知道,密文也就随之破解。

320px-Caesar3.svg.png

比如每个字母右移12位,将 "All models are wrong, but some are useful."通过Caesar加密,得到如下密文:
"Mxx yapqxe mdq idazs, ngf eayq mdq geqrgx."

加密后的文本不可读,但若得到位置信息,即可将每个字母左移12位,即可得到原文。如果不知道这个位置信息,就需要暴力穷举,对于Caesar加密而言,只有25种情况(因为看到的密文已经是一种),这适合用计算来解决。

再进一步论述之前,需要说说英语本身的一种特性。在英语中,每个字母出现的频次是不一样的,有的很高,有的很少出现,比如字母e经常出现,而字母z则很少出现。理论上,可以得到每个字母的出现百分比。

a b c d e f g h i j k l m
8.2 1.5 2.8 4.3 12.7 2.2 2 6.1 7 0.2 0.8 4 2.4
n o p q r s t u v w x y z
6.7 7.5 1.9 0.1 6 6.3 9.1 2.8 1 2.4 0.2 2 0.1

对于Caesar加密,虽然字母被映射成别的字母,但是也将相应字母的出现频率映射给新的字母,比如出现几率最高的e,如果被映射成h,则在Caesar加密后,统计词频,可以发现h的出现几率最高。对于其他的字母,有类似的情况。这也为通过词频破解Caesar加密提供了思路。

对于一段密文,左移(或者右移),然后统计其词频,并与标准的英语字母词频做比较。若移动的位数正好是Caesar加密所使用的位数,则每个字母的词频与标准英语字母的词频比较接近,否则相差应该较大。这种差异可以通过卡方统计量来刻画,

对于26个字母,在标准英语下,每个字母具有比例$\pi_{1i}$,其中$i = 1, 2, 3, .., 26$;对于待解密的文本,某次移动后,每个字母的出现频率为$\pi_{2i}$,其中$i = 1, 2, 3, ..., 26$。

可以构建极大似然统计量,当文本较多时,可以等价地构建皮尔逊卡方统计量。[2][]

$$\chi^2 = n\sum_{i = 1} ^{26} \frac{ (\pi_{2i} - \pi_{1i})^2 } { \pi_{1i} }$$

其中$n$是带解密文本中字母的个数。如果$\pi_{2i}$与$\pi_{1i}$一致,则该统计量较小,否则该统计量较大。也就是说卡方统计量的大小衡量移位后词频与标准词频之间的匹配程度。对于Caesar加密,穷举所有可能的移位,计算其对应的卡方统计量,其最小值对应的文本,很有可能是正确解密的文本。由于对于一段固定的密文,$n$是常数,故可在计算中忽略不计。

$$\chi^2 = \sum_{i = 1} ^{26} \frac{ (\pi_{2i} - \pi_{1i})^2 } { \pi_{1i} }$$

[2]: John A. Rice, 数理统计与数据分析, page 263.

相关文章

  • 当密码学遇上统计学

    标题取的很大,主要是为了将文章上升到科学的层次,而不仅仅是某一项具体的应用。 本文简述卡方统计量的思想,及其在Ca...

  • 细化问题

    finally与return的关系 random 统计学,密码学prng 可预测 种子 getlocalhost ...

  • 当统计学遇上大数据——P值消亡

    有一天,我走进统计学的神殿 ,将所有谎言都装进原假设的盒子里, “P值为零”, 一个声音传来, “但你已经不能再拒...

  • 和你相遇的概率近乎奇迹,我要紧紧拥抱你!

    统计学关于遇上真爱的概率,微乎其微到惊人。 所以,你们的相遇,是个意外。 你遇上了爱,你们拥有了爱。 你们照顾陪伴...

  • 你我之间最美的遇见

    当青椒遇上互加,当课程遇上学校,当学生遇上平板,所有的美好便从这一刻开始了… 当,当,当,当…开学...

  • 【转】不说,是一种智慧

    当流年遇上了光阴荏苒,不说; 当生命遇上了疾病和磨难,不说; 当阳光遇上了空气和鲜花,不说; 当友情遇上了误解和嫉...

  • 追梦

    当黄昏遇上海浪, 当海鸥遇上蓝天, 当珊瑚遇上沙滩, 当我们遇上你—年轻的日照, 一切都刚刚好。 微风追逐着海浪,...

  • 你(诗)

    当候鸟遇上迁徙 当花儿遇上雨季 当落叶遇上淤泥 一切都不尽人意 当我遇上你 候鸟安定 繁花沐浴 落叶归根 我随你而...

  • 你们HR月薪多少?三万多一点吧!

    HR的日常 一人之上 万人之下 当HR遇上业务部门 当HR遇上员工 当HR遇上老板

  • 收集暖暖情话

    当粉笔遇上黑板,就有了知识纵‌横; 当难题遇上智慧,就有了标准答案; 当愚顽遇上榜‌样,就有了行为标准; 当XX遇...

网友评论

      本文标题:当密码学遇上统计学

      本文链接:https://www.haomeiwen.com/subject/bmdrhttx.html