第501章 幻数据压缩算法2

A+A-

    =数据压缩算法=统计算法=

    0000;000;000;00;

    把数据按照顺序对齐:

    0000;000;000;00;

    把数据按照大对齐:

    00;000;000;0000;

    把数据按照近似对齐:

    00和0000互为求反;000和000互为求反;

    每一段数据,都有多个标签,通过添加标签的方式,从而减少数据穷举试错的次数。

    =有限进制速记算法=

    把任何数都可以记录为^b*!+d;的b次方乘以的阶乘加d;

    如43的3次方乘以3的阶乘加49939

    43^3*3!+49939

    43^3=2436620236339996029566e+60

    3!=222365492225562e+33

    43^3*3!=225600635230620922534562356e+94

    =跳数统计速记算法=

    如0000000000000000000000000000

    23456902345690234569023456作者避免自己看看得眼睛疼,所以使用数字在特定字体下宽度和高度是一样的方式,来进行作为标尺,数间隔多少位用的。

    使用跳一位的方式统计,结果如下:

    奇数次生效:偶数次被当做0:(中间有4个0,其中出现过一次)(中间有个0,其中出现过一次)(中间有2个0,其中出现过一次)+尾数0000000

    偶数次生效:头数0+(中间有6个0,其中出现过一次)(中间有0个0,其中出现过一次)(中间有4个0,其中出现过一次)

    然后把这些数据比对合并,就能得出源数据。

    使用跳两位的方式统计,结果如下:

    第一个对齐:(中间有个0,其中出现过两次)(中间有个0,其中出现过两次)+尾数0000000

    第二个对齐:头数0+(中间有个0,其中出现过两次)(中间有20个0,其中出现过两次)

    第三个对齐:头数000+(中间有个0,其中出现过两次)(中间有4个0,其中出现过两次)+尾数0000000000000

    也就是,当和0不连续的情况出现得越多,那么使用跳n个(以及另一个注册表中跳n个0)的统计数据,n的取值越大,压缩比例越高;当和0不连续的情况出现得越少,那么使用跳n个(以及另一个注册表中跳n个0)的统计数据,n的取值越(不排除n=0的情况),压缩比例越高;

    =数据对齐算法=

    如:

    0000000000000000000000000000

    000000000000000000

    000000000000000000

    23456902345690234569023456

    第一种标尺:0循环充满

    完全一致:(,2,3,4,,2,4,5,6,,20,2,22,24,26,30,32,34)

    完全单比特求反:(5,6,,9,0,,3,,9,23,25,2,2,29,3,33)

    第二种标尺:00循环充满

    完全一致:(,2,,,4,,9,2,22,23,26,2,2,30,3,34,35,36)

    完全单比特求反:(3,4,5,6,,9,0,2,3,5,6,,20,24,25,29,32,33)

    第n种标尺:????

    完全单比特一致:(*,*,*)

    完全双比特一致:(*,*,*)

    完全多比特一致:(*,*,*)

    完全单比特求反:(*,*,*)

    完全双比特求反:(*,*,*)

    完全多比特求反:(*,*,*)

    使用的算法越多,那么算法所生成的数据就越多,相应的就可以快速互相校验,从而避免个比特的篡改导致最终损失zb其中的900tb数据的极端压缩文件异常灾难;毕竟压缩率越高,就意味着一旦出现了压缩文件缺失以及特定数据不可读取(比如硬件损坏,磁盘坏道,软件权限不足)就会导致最终解压缩所缺失的部分越多;压缩率越高,就要求容错能力和纠错能力越强,比如,把zb的数据,压缩成gb数据,gb数据中随有百分之五十的数据不可读取,是否能够通过剩下的百分之五十数据逆推出整个gb数据内容?从而可以解压缩成原先的压缩前的zb数据(当然了,容错和纠错就难免会增加试错和穷举的运算量)。