json数据压缩

湛光华

2023-12-01

json是一种非常简单、易读的数据结构。通常我们在做开发时，会选取json作为数据传输格式。同时为了提升性能、降低带宽，我们一般会对json数据进行压缩。今天我们就来谈谈各种压缩方法。

1、常规压缩：

默认的json数据是带有换行的，所以最简单的压缩方法是将json中的回车换行去掉，压缩成一行字符串。

测试：找了一个大的json字符串，原始大小为1.1m，去掉回车换行压缩成一行后，大小变为了360k。

在线压缩工具：https://www.bejson.com/

其次，我们还可以将json中的key变短，设置可以是无意义的符号（只要我们规定好含义即可），这样也能减少json大小。

2、使用gzip、deflate算法压缩：

json本身就是一个文本信息，所以我们可以使用gzip、deflate等算法对其进行压缩，它们都是使用哈弗慢编码的一个无损数据压缩算法，对文本内容压缩的压缩比很高，基本在80%以上。大多数浏览器也都是使用这两种方式对http协议中的响应实体进行压缩。

这里不过多举例子，有兴趣的同同学可以自行尝试。

3、CJSON和HPack压缩算法：

这两种都是针对json数据结构压缩的算法。其主要思路都是将原始json数据抽离成 Template 与 Value，节省掉重复的 "Key 值"。1）cjson压缩：

例如，一个原始json：

[
    {
        "x": 100,
        "y": 100
    },
    {
        "x": 100,
        "y": 100,
        "width": 200,
        "height": 150
    },
    {},
]

使用cjson压缩后：

{
    "templates": [
        [0,"x","y"],
        [1,"width","height"]
    ],
    "values": [
        {
            "values": [1,100,100 ] 
        },
        {
            "values": [2,100,100,200,150 ] 
        },
        {}
    ]
}

2）hpack压缩：

hpack是一个无损、跨语言、注重性能的数据集压缩程序。它能够将用于表示泛型同构集合的字符数减少70%。此算法提供了多个级别的压缩（从0到4）。级别0压缩通过从结构中删除键（属性名）来执行最基本的压缩，该结构在索引0上创建一个具有每个属性名的头。下一个级别允许通过假设存在重复的条目来进一步减小JSON的大小。
原始json：

[{
 
  name : "Andrea",
 
  age : 31,
 
  gender : "Male",
 
  skilled : true
 
}, {
 
  name : "Eva",
 
  age : 27,
 
  gender : "Female",
 
  skilled : true
 
}, {
 
  name : "Daniele",
 
  age : 26,
 
  gender : "Male",
 
  skilled: false
 
}]

压缩后：

[
    [ "name","age","gender","skilled"],
    ["Andrea",31,"Male", true],
    [ "Eva", 27,"Female",true],
    ["Daniele",26,"Male",false]
]

结论：
两种方法都是主要讲json 的键抽出来统一建成索引，只是最后的格式不同，HPack 简化后的格式比CJSON 少了许多字符，所以HPack 的压缩效率比较高, 如果 JSON 内容太少, CJSON的资料可能反而会比较多。

参考：

https://blog.csdn.net/ZYC88888/article/details/104697362

json数据压缩

相关阅读

相关文章

相关问答

相关文档