第501章 幻数据压缩算法2
=数据压缩算法=统计算法=
0000;000;000;00;
把数据按照顺序对齐:
0000;000;000;00;
把数据按照大对齐:
00;000;000;0000;
把数据按照近似对齐:
00和0000互为求反;000和000互为求反;
每一段数据,都有多个标签,通过添加标签的方式,从而减少数据穷举试错的次数。
=有限进制速记算法=
把任何数都可以记录为^b*!+d;的b次方乘以的阶乘加d;
如43的3次方乘以3的阶乘加49939
43^3*3!+49939
43^3=2436620236339996029566e+60
3!=222365492225562e+33
43^3*3!=225600635230620922534562356e+94
=跳数统计速记算法=
如0000000000000000000000000000
23456902345690234569023456作者避免自己看看得眼睛疼,所以使用数字在特定字体下宽度和高度是一样的方式,来进行作为标尺,数间隔多少位用的。
使用跳一位的方式统计,结果如下:
奇数次生效:偶数次被当做0:(中间有4个0,其中出现过一次)(中间有个0,其中出现过一次)(中间有2个0,其中出现过一次)+尾数0000000
偶数次生效:头数0+(中间有6个0,其中出现过一次)(中间有0个0,其中出现过一次)(中间有4个0,其中出现过一次)
然后把这些数据比对合并,就能得出源数据。
使用跳两位的方式统计,结果如下:
第一个对齐:(中间有个0,其中出现过两次)(中间有个0,其中出现过两次)+尾数0000000
第二个对齐:头数0+(中间有个0,其中出现过两次)(中间有20个0,其中出现过两次)
第三个对齐:头数000+(中间有个0,其中出现过两次)(中间有4个0,其中出现过两次)+尾数0000000000000
也就是,当和0不连续的情况出现得越多,那么使用跳n个(以及另一个注册表中跳n个0)的统计数据,n的取值越大,压缩比例越高;当和0不连续的情况出现得越少,那么使用跳n个(以及另一个注册表中跳n个0)的统计数据,n的取值越(不排除n=0的情况),压缩比例越高;
=数据对齐算法=
如:
0000000000000000000000000000
000000000000000000
000000000000000000
23456902345690234569023456
第一种标尺:0循环充满
完全一致:(,2,3,4,,2,4,5,6,,20,2,22,24,26,30,32,34)
完全单比特求反:(5,6,,9,0,,3,,9,23,25,2,2,29,3,33)
第二种标尺:00循环充满
完全一致:(,2,,,4,,9,2,22,23,26,2,2,30,3,34,35,36)
完全单比特求反:(3,4,5,6,,9,0,2,3,5,6,,20,24,25,29,32,33)
第n种标尺:????
完全单比特一致:(*,*,*)
完全双比特一致:(*,*,*)
完全多比特一致:(*,*,*)
完全单比特求反:(*,*,*)
完全双比特求反:(*,*,*)
完全多比特求反:(*,*,*)
使用的算法越多,那么算法所生成的数据就越多,相应的就可以快速互相校验,从而避免个比特的篡改导致最终损失zb其中的900tb数据的极端压缩文件异常灾难;毕竟压缩率越高,就意味着一旦出现了压缩文件缺失以及特定数据不可读取(比如硬件损坏,磁盘坏道,软件权限不足)就会导致最终解压缩所缺失的部分越多;压缩率越高,就要求容错能力和纠错能力越强,比如,把zb的数据,压缩成gb数据,gb数据中随有百分之五十的数据不可读取,是否能够通过剩下的百分之五十数据逆推出整个gb数据内容?从而可以解压缩成原先的压缩前的zb数据(当然了,容错和纠错就难免会增加试错和穷举的运算量)。