美文网首页
<论文笔记>Caradoc: a pragmatic

<论文笔记>Caradoc: a pragmatic

作者: 娄叔啊喂 | 来源:发表于2017-03-22 14:26 被阅读23次

Caradoc:PDF解析与验证的实用方法

引用:

Endignoux G, Levillain O, Migeon J Y. Caradoc: A Pragmatic Approach to PDF Parsing and Validation[C]// IEEE Security and Privacy Workshops. IEEE Computer Society, 2016:126-139.

研究内容:

研究PDF文档的结构、语法及由其引起的漏洞和阅读器冲突

背景:

  • 介绍了已知的问题和检测方法
    1.Polymorphic files(多态文件):不同的PDF阅读器接受有缺陷的或者格式混淆的文件并显示出不同的内容
    2.Analysis of JavaScript content(JS内容分析):PJScan、MDScan、FCScan
    3.Statistical methods(静态分析方法):machine learning、reverse mimicry
  • 结构性问题
    1.交叉引用表、树和图等的无限循环
    2.解析和验证库的差异问题
    3.对象序号的捕捉问题等

方法:

针对由于PDF文档结构所引起的问题,将重点放在对文档格式的限制:
1.(为消除多态文件)语法(grammmar)限制和规范化:定义LR1或者LALR1语法,设置去掉注释、限制空格的语法规则,扩展规则和规范化
2.类型检验:用图的广度优先遍历算法来验证对象类型的一致性
3.高级属性的验证

实现流程:



创新点:

1.创建基础结构缺陷的PDF文档进行多阅读器环境测试
2.通过语法和结构定义解决不同阅读器的解析差异问题

相关文章

网友评论

      本文标题:<论文笔记>Caradoc: a pragmatic

      本文链接:https://www.haomeiwen.com/subject/fgubnttx.html