当前位置: 首页 > 面试题库 >

JSON字符串中的二进制数据。比Base64更好的东西

陶俊晤
2023-03-14
问题内容

该JSON格式本身不支持二进制数据。必须对二进制数据进行转义,以便可以将其放入JSON中的字符串元素(即使用反斜杠转义的双引号中的零个或多个Unicode字符)。

逃脱二进制数据的一种明显方法是使用Base64。但是,Base64具有较高的处理开销。它还将3个字节扩展为4个字符,这导致数据大小增加了约33%。

一个用例是CDMI云存储API规范的v0.8草案。您可以使用JSON通过REST-
Webservice创建数据对象,例如

PUT /MyContainer/BinaryObject HTTP/1.1
Host: cloud.example.com
Accept: application/vnd.org.snia.cdmi.dataobject+json
Content-Type: application/vnd.org.snia.cdmi.dataobject+json
X-CDMI-Specification-Version: 1.0
{
    "mimetype" : "application/octet-stream",
    "metadata" : [ ],
    "value" :   "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz
    IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg
    dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu
    dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo
    ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=",
}

是否有更好的方法和标准方法将二进制数据编码为JSON字符串


问题答案:

根据JSON规范,有94个Unicode字符可以表示为一个字节(如果JSON以UTF-8格式传输)。考虑到这一点,我认为您可以在空间上做到最好的是base85,它代表四个字节五个字符。但是,与base64相比,这仅提高了7%,计算成本更高,并且实现比base64少,因此这可能不是胜利。

您还可以简单地将每个输入字节映射到U + 0000-U +
00FF中的相应字符,然后执行JSON标准所需的最小编码以传递这些字符;这样做的好处是所需的解码比内置函数要少零,但是空间效率很差-
扩展105%(如果所有输入字节均等的可能性),而base85为25%,base64为33%。

最终判决:BASE64胜,在我看来,其理由是它的普通,简单,不坏 足够的 认股权证更换。

另请参阅:Base91和Base122



 类似资料:
  • 如何比较字符串二进制(而不是字母数字)?? Torrent规格: 键必须是字符串,并且以排序顺序出现(排序为原始字符串,而不是字母数字)。应该使用二进制比较,而不是特定于区域性的“自然”比较来比较字符串。 所以我需要按键对口供进行排序...但我没有这个规格。解释..有人吗? 更新:http://docs.oracle.com/cd/b19306_01/server.102/b14225/ch5li

  • 问题内容: 程序从经过排序的字符串的txt文件中读取,并使用顺序的,迭代的二进制和递归的二进制存储在数组中,然后在数组中搜索位置以及查找该单词所需的迭代次数。当我尝试将数组中的单词与用户输入的单词进行比较时出现错误。不知道为什么。2)希望有人可以解释迭代二进制和递归二进制之间的区别。3)为什么需要这样做… SearchString si = new SearchString(); 程序在下面… }

  • 我有两个字符串的输入,每个字符串以十进制格式表示一个非负有理数。 给定这两个字符串,我想检查由x表示的数值是否大于由y表示的数值。 这两个值可以非常大,也可以扩展到非常高的精度(即小数点后的许多数字)。 因此,我不能依赖

  • 问题内容: 我当时用salt实现密码哈希,所以我以二进制形式生成了salt,对密码进行了哈希处理,对base64进行了编码,然后将salt存储到数据库中。 现在,当我检查密码时,应该将盐解码回二进制数据,使用它来哈希提供的密码,对结果进行base64编码,并检查结果是否与数据库中的结果匹配。 问题是,我找不到将盐解码回二进制数据的方法。我使用Buffer.toString方法对它们进行了编码,但似

  • 问题内容: 我们正在捕获大小可变(从100k到800k)的原始二进制字符串,并且我们想存储这些单独的字符串。它们不需要索引(duh),并且不会对该字段的内容进行任何查询。 这些插件的数量将非常大(用于存档),例如每天10,000。像这样的大型二进制字符串的最佳字段类型是什么?应该是还是其他? 问题答案: 就 PostgreSQL 而言,类型是不可能的。与目标相比,它更慢,占用更多空间并且更容易出错

  • 我如何将一个写为二进制的字符串转换为二进制(字节数组)? 如果我有一个字符串: 下面是当我将二进制设置为字节数组时发生的情况(字节数组返回48,这是ASCII) 我不擅长解释,所以希望上面的例子足以告诉你我想要什么。