第495章 幻数据压缩算法猜想1
=数据压缩算法=速记算法=
递增素数之间,可以使用加法,得出相对的数,可以用乘法,得出相对大的数,可以用乘方号,得出很大很大的数。
当使用特定长度把一个大数据分割成n个片段时,就可以进行统计,比如全体相加,然后除以总数得到全局平均数。
然后使用kb的平均数,b的平均数,gb的平均数作为比大基准。
然后还有特定数(比如出现了一次以上的多次数)(比如只出现了一次的一次数)(比如出现的最大值)(比如出现的最值)。
现在的问题就是,统计能够获得数据的被过滤掉了很多信息的被压缩后的数据,如何使用统计获得的数据,来逆推原始数据(包括各种统计的先后顺序)(当然,因为数据的缺失,导致必须使用试错方式来实现)。
在处理大数据时,如何减少解压缩时试错次数,就是大数据压缩专用算法的重难点。
[示例]
如果有一个二进制数0000000000000000000,统计出其二进制的总共有2个,二进制的0总共有9个;转换为八进制为222346042,统计出其八进制的0总共出现了次,八进制的出现了2次,八进制的2出现了4次,八进制的3出现了次,八进制的4出现了2次,八进制的6出现了次;转换为十进制为306642,统计出其十进制的0出现了次,十进制的出现了次,十进制的2出现了次,十进制的3出现了次,十进制的4出现了次,十进制的6出现了2次,十进制的出现了3次(当然了,为了加速碰撞,一般都是使用素数进制的方式,而不是使用这种方式,作者用这种方式示例,只是为了方便使用微软自带的程序员计算器换算进制,从而进行统计),那么接下来,就需要通过进制碰撞的方式,来逆推根据统计得出的原始数据。
当然了,也可以使用d4,d5和其他的哈希值生成算法,用于快速生成哈希值,以及记录上大,然后是二进制的0和,然后是八进制,6进制(一般都采取2的正整数次方进制的方式,来加速快速压缩时的速度,换算更快)。
另外还有一种快速碰撞的方式,使用大于的(y+次方),于的y次方的方式。
第一次比大范围:
示例:取=6;y=;
6^9=5,55,63,25,94,323,49,36
6^=4,22,366,42,69,645,23,696
第二次比大范围:
示例:取=5;y=;
5^=2,562,90,625
5^=0,59,35
当然了,因为作者并没有使用6^9-6^,然后再把结果进行开5次方,然后再进行筛查,可能就会导致第二次和第一次的相关度不高。
一个二进制数据根据位数,可以表达多少数值?
位二进制,有两种可能,和0。
2位二进制,有四种可能,00,0,0,。
6位二进制,有2的6次方种可能,然而一个数据本身使用这么多位是一种浪费。
也就是,一个6位二进制所表达的数,是一个固定数,是大于或等于0,于2的6次方+。
就比如,一个zb大的数据,只要其本身是固定的,那么就注定大于或等于0,然后于2的多少次方来着???+。
表达固定的数,并不一定需要使用到很长的长度。
比如2的965432次方,可以是一个很大的数,其换算成二进制,会占用多大的存储空间?然后是不是可以逆推为算术内容:2的965432次方?
问题就是,并非所有的数,都是规律数,都可以使用的b次方+乘以d+e阶乘方式正好等于该数,也就导致往往只能采取使用比大的方式,无限近似,大于某个最接近该数的数,于某个最接近该数的大数。
比如,想要记录一个5,那么在只能使用素数的表达方式时,就可以记录为该数大于3,于。
使用大于和于之后,就可以获得一个数据范围,该范围内可能包含有有数的可能性,接下来的方法,就是把这个可能性减少,比如(3+)/5=2,则表示这个数正好处于大于和于的中间值,比如(3+)/4=25,则表示这个数正好大于大于和于的中间值;以此类推;
设定一个数为未知数b,大于b于。
那么就可以取近似值(+b)/=d
一般情况下,d都是带有数的,那么把d的数去掉,那么d的整数部分就可以作为第二轮的最值,d+就可以作为第二轮的最大值。
取(+b)/=区间值(也就是更靠近,还是更靠近b)。
(-b)/(b-)=区间值2
(+)/b=区间值3
(b+)/=区间值4
还有一种固定数大于于法,就是+b+}总长度为多少位,特定数大于某个可以用循环速记法记录的数,于某个可以用循环速记法记录的数。
然后就是使用特定算法生成一个数,该数大于b,然后使用特定刷房生成一个数,该数于b。
示例:3*=2;4*5=20;3*大于b于4*5;那么就可以获得该数百分之八十的近似值,然后再使用不断精准的继续用比大法接近的方式,获得。
比如345926
第一次比大:4大于圆周率大于3
第二次比大:34于圆周率于35
第三次比大:34592于圆周率于34593
比大之后,就是使用一个算术,来生成更接近的比大精准度。
比如第一次比大,大和之间相差2的6次方,第二次比大,大和之间相差2的4次方,第三次比大,大和之间相差2的2次方,以此类推,就能快速还原出原始数据。
tb的固定数据,可以使用gb的算法来生成,gb算法当做固定数据,就能使用kb的算法来生成,这就是tb2kb算法的原理。