美文网首页以太坊原理解析
[以太坊源码分析]:RLP编码

[以太坊源码分析]:RLP编码

作者: jea的笔记本 | 来源:发表于2019-02-09 19:59 被阅读0次

RLP编码

RLP编码是以太坊对象序列化和反序列化的主要方法,可编码任意嵌套的二进制数据。以太坊中多个地方都用到了RLP编码,例如区块,交易等。

RLP是 Recursive Length Prefix 三个单词的缩写,分别是递归,长度,前缀。以下是我的理解:递归指可以处理嵌套的数据结构,长度指编码是对数据的长度进行处理,前缀指编码结果是在数据前加一个前缀。

0.索引

01.为什么要使用RLP编码
02.RLP编码规则
03.总结

1.为什么要使用RLP编码

使用RLP编码的情况下,需要保存的额外数据比较少。RLP编码结果的前缀不会超过9个字节,举个例子:

type Tests struct{
    Name string
}
t := Tests{Name:"abc"}
  • 1.采用JSON编码,t的编码结果为{"Name":"abc"},长度为14个字节。
  • 2.采用RLP编码,t的编码结果为0x83616263,直观的表示为131 a b c,长度为4个字节。

t的有效的数据长度为3个字节,采用JSON编码的时候,额外的数据长度为11个字节,而采用RLP编码的时候,额外的数据长度为1个字节(即前缀)。由此可见,RLP编码可以节省编码后的数据的存储空间,这对以太坊来说是很必要的,区块和交易编码后的长度跟原来的长度相差不大,节省了存储空间的开销。

2.RLP编码规则

在以太坊的黄皮书附录B中,定义了如下的两种数据结构:



简单的理解为,L为列表类型的数据,B为字节数组,字符串类型的数据。如果是其他的数据类型,则需要先转换为这两种数据类型,比如说,结构体转换为嵌套的列表,布尔类型转换为整型。对此两种数据类型的RLP编码表示为:



RLP编码的规则一共有5个,3个对于字节数组而言,剩下2个与列表有关。
字节数组
字节数组的编码过程

Rb(x)涉及了3个规则:

  • 1.单个字节,小于128,结果为该字节
  • 2.字节数组,长度小于56,结果为128+字节数组长度,各个字节的编码两部分
  • 3.字节数组,长度大于等于56,结果为183+字节数组长度编码的长度,字节数组长度,各个字节的编码三部分 (长度不能超过288)

举个例子:

  • 1.单个字节:z => “7A”
    (z的十六进制ascii码为7A)
  • 2.长度小于56的字节数组:xyz => “8378797A”
    83为128+3的十六进制表示,xyz分别为78 79 7A)
  • 3.长度大于等于56的字节数组:“Lorem ipsum dolor sit amet, consectetur adipisicing elit” =>“B8384C6F72656D20697073756D20646F6C6F722073697420616D65742C20636F6E7365637465747572206164697069736963696E6720656C6974”
    (B8为183+1,1为字节数组长度56的编码长度;38为字节数组长度56十六进制;其余为各个字节的编码)

BE(x),去掉前导零的大端表示 (bn是8个字节的,所以以8个字节为例)
例如:1024 -> 0x00 00 00 00 00 00 04 00 -> 0x0400

(a)·(b,c)·(d,e) = (a,b,c,d,e),指的是字节的拼接,类似于把字符串连接起来。

列表
列表的编码过程

Rl(x)涉及了2个规则:

  • 1.列表,长度小于56,结果为192+列表长度,各个字节的编码两部分
  • 2.列表,长度大于等于56,结果为247+列表长度编码的长度,列表长度,各个子列表的编码三部分

举个例子:

  • 1.长度小于56的列表:[ 1, 2, 3] => “C3010203”
    C3为192+3的十六进制表示)
  • 2.长度大于等于56的列表:["aaa", "bbb", "ccc", "ddd", "eee", "fff", "ggg", "hhh", "iii", "jjj", "kkk", "lll", "mmm", "nnn", "ooo“] =>“F83C836161618362626283636363836464648365656583666666836767678368686883696969836A6A6A836B6B6B836C6C6C836D6D6D836E6E6E836F6F6F”
    F8为247+1,1为总的列表长度60的编码长度;3C为60十六进制表示;bbb为一个子列表83626262,80+3,以及b为62)

3.总结

  • 1.RLP编码是以太坊对象序列化和反序列化的主要方法,对数据进行编码,编码结果为在原本的数据前增加一个前缀。可节省编码后的数据的存储空间。
  • 2.RLP编码有5个规则,3个规则适用于字节数组,2个规则适用于列表。根据字节数组和列表的不同长度使用不同的编码规则。

相关文章

  • 以太坊rlp编解码规则及实现

    rlp编码 具体规则定义可参考该文章以太坊源码学习—RLP编码 这里摘录其关键部分 编码数据类型 (1)byte数...

  • [以太坊源码分析]:RLP编码

    RLP编码 RLP编码是以太坊对象序列化和反序列化的主要方法,可编码任意嵌套的二进制数据。以太坊中多个地方都用到了...

  • RLP 递归长度前缀

    RLP 递归长度前缀 RLP(recursive length prefix):递归长度前缀。 RLP编码是以太坊...

  • RLP编码原理

    RLP编码原理 RLP(Recursive Length Prefix,递归长度前缀)编码算法,是以太坊中数据序列...

  • go-ethereum以太坊源码解析完整版

    目录 go-ethereum代码阅读环境搭建 以太坊黄皮书 符号索引 rlp源码解析 trie源码分析 ethdb...

  • 以太坊交易签名

    以太坊的Transcation结构如下: 对交易签名步骤如下: 对交易本身进行rlp编码,再对rlp编码进行kec...

  • 以太坊源码研读0x04 RLP源码解析

    RLP(Recursive Length Prefix),递归长度前缀编码,它是以太坊序 化所采取的编码方式。RL...

  • 以太坊源码研究之RLP编码

    这是以太坊源码研究的第一篇文章。基本上来说,我写什么内容,说明我正好在学习什么内容,并没有固定的顺序。之所以先写R...

  • 以太坊C++源码解析(四)RLPStream类

    RLP是一种特殊的二进制编码解码方式,以太坊里数据包都是采用这种方式编码的,和传统的结构相比,RLP编码更节省空间...

  • 以太坊源码解析 - RLP

    RLP(Recursive Length Prefix),叫递归长度前缀编码,它是以太坊序列化所采用的编码方式。R...

网友评论

    本文标题:[以太坊源码分析]:RLP编码

    本文链接:https://www.haomeiwen.com/subject/arrokqtx.html