sol数据区是按照key-value方式存储的,存储的顺序是:key的长度-key-value类型-value长度(仅字符串)-value-00.
其中key的长度是按2n+1(n为长度)计算的,如0x05换算为长度是2
key是根据前面的长度取随后的几个字节,若前面长度是2那就应该取0x05后的两个字节做为key,sol默认为utf-8格式的所以如果是windows系统下中文key或者value的需要指定UTF-8字符集。
接下来是value的类型,类型我也并未解析完全。
- 02 逻辑非
- 03 逻辑是
- 04 整型
- 05 长整,小数
- 06 字符,字符串
- 09 数组
- 0a Object对象
以上所有类型后面都接00。
逻辑值解析(02,03)
逻辑值解析比较简单,因为是和非是分开处理的所以02,03既是类型也是值。如下是isA=true的解析示例
字符&字符串解析(06)
字符串解析也较简单,在类型06后面会跟value长度(长度也是按2n+1的方式计算),随后是value值,这里需要注意的是sol默认编码为utf-8,所以注意windows系统下中文需要对编码进行utf8处理。如下是name=左拖拖的解析示例
字符串key=value时处理
整数解析(04)
sol整数范围是-228 ~ 228-1,其中02<sup>21</sup>-1为小整,2<sup>21</sup>228-1为大整,sol对小整,大整以及负数的处理都是不同的。
- 小整 最低位从007f其余位从80ff,最低位大于7f时产生进位
- 大整 占用4个字节,最低位从00ff其余位从80ff
- 负数 占用4个字节,最低位从ff00,其余位从ff80
举个小整的例子:04 86 a0 2d 00
1). 04是类型,00是结束符,中间的位数表示值。
2). 最低位2d不做处理
3). 除了最低位从007f,其余位从80ff,所以其余位需要减掉80
4). 第二位a0的处理: (a0 - 80) x 80
5). 第三位86的处理: (86 - 80) x 80 x 80
6). 最后将三位的结果相加即可: 98304 + 4096 + 45 = 102445
大整与小整的处理方式相同,只是进位从80变成为ff,就不做例子了。
再举个负数的例子:04 ff ff ff ff 00
负数的处理与大整完全相同,与二进制负数也很相似,只是符号位并不会占整个最高。二进制最高位0表示正,1表示负。上面被解析为-1
长整&小数解析(05)
整数从41 b0开始,负数从c1 b0开始,小数未破解成功。
该类型的值长度固定为8,前五位与整数处理相同每位均从00ff,后三位可以看成补位或借位,前面提到位数从00ff如果需要表示更大的数就从后三位借位让后三位与第四位组成一个阶数。
若41 c0 00 00 00 00 00 00 表示1 则41 c0 00 00 00 80 00 00 表示2
41 c0 00 00 01 00 00 00 表示3 则41 c0 00 00 01 80 00 00 表示4
这样的话就可以将表示范围扩大到2N倍。
负数处理完全一样无特殊处理。
测试过程中发现最大可处理9007199254740992(后三位刚好使用完ff ff ff),超过9007199254740992将无法正常处理负数超过-9007199254740993无法正常处理。
其中有一个特殊的值-0也被解析为长整80 00。
举个例子:05 42 20 00 03 c4 80 00 00 00
1).前两位42 20 比起始值41 b0 大 7 x 16
2).根据前面提的范围扩大2N倍那解析出(20 + 21 + 22 + 23 + 24 + 25 + 26) x 16 x 2563 = 34091302912
3).03 : 3 x 2561 x 27 = 98304
4).c4 : 196 x 2560 x 27 = 25088
5).后三位的处理是从高位到低位的,0x80 / 256 / 27 = 64
6).最后相加 34091302912 + 98304 + 25088 + 64 再加上起始的41 b0(1 << 28)最后得到34359861824
数组解析(09)
数组的解析,类型后面紧跟数组长度,长度后面一位用途暂时未知,后面的部分是结合上面所有的类型进行处理,如下是one-dimensional={"a", "b", "c"}的解析示例
网友评论