当前位置: 首页 > 工具软件 > Swish-e > 使用案例 >

Swish-e搜索引擎中的数据压缩算法(二)

汪正雅
2023-12-01

   基本原理是将LONG型分为byte组(需要注意字节顺序,即:big endian little endian),然后通过fwrite将数组按照顺序写入到文件中。读取LONG型时,fread每个字节,并对字节进行移位操作,组成LONG型。这里应该称为数据处理,应该不算做压缩处理。

基本代码(来自swish-e 2.4.5)为:

 


需要注意的是,如果机器是Little endianthe first read byte is the biggest),首先读取的字节为最低位,需要将字节顺序逆序。先将LONG型中的高位byte放在第一个unsigned char中。

       LONG长整型变化以后,通过printlongLONG型写入到文件中,基本代码为中:

LONG型的读取和恢复。

首先从文件中读取LONG型的数据,此时为处理以后的数据,还需要恢复。

然后恢复读取的LONG型数据为正确的格式,基本代码(swish-e2.4.5)为:

如果是Little endian,则将先读取的byte数据,右移sz_long * 8位,最后组成正确的LONG型数据。

   通过以上处理,可以讲LONG型数据变换处理以后,通过bianry文件的方式进行存取。

 

 

 

 

 类似资料: