当前位置: 首页 > 面试题库 >

Base64数据的流解码

冯峻
2023-03-14
问题内容

我有一些大型的base64编码数据(存储在hadoop文件系统中的快照文件中)。该数据最初是压缩的文本数据。我需要能够读取此编码数据的大块,对其进行解码,然后将其刷新到GZIPOutputStream。

关于如何执行此操作而不是将整个base64数据加载到数组中并调用Base64.decodeBase64(byte [])的任何想法?

如果我读了直到’\ r \ n’分隔符并逐行解码的字符,对吗?例如:

for (int i = 0; i < byteData.length; i++) {
    if (byteData[i] == CARRIAGE_RETURN || byteData[i] == NEWLINE) {
       if (i < byteData.length - 1 && byteData[i + 1] == NEWLINE)
            i += 2;
       else 
            i += 1;

       byteBuffer.put(Base64.decodeBase64(record));

       byteCounter = 0;
       record = new byte[8192];
    } else {
        record[byteCounter++] = byteData[i];
    }
}

可悲的是,这种方法没有提供任何人类可读的输出。理想情况下,我想流式传输读取,解码和流式传输数据。

现在,我正在尝试放入输入流,然后复制到gzipout

byteBuffer.get(bufferBytes);

InputStream inputStream = new ByteArrayInputStream(bufferBytes);
inputStream = new GZIPInputStream(inputStream);
IOUtils.copy(inputStream , gzipOutputStream);

它给了我一个java.io.IOException:损坏的GZIP预告片


问题答案:

让我们一步一步走:

  1. 您需要a GZIPInputStream来读取压缩的数据(而不是GZIPOutputStream;输出流用于压缩数据)。有了这个流,您将能够读取未压缩的原始二进制数据。这要求InputStream在构造函数中。

  2. 您需要一个能够读取Base64编码数据的输入流。我建议Base64InputStream从apache-commons-codec派上用场。使用构造函数,您可以设置行长,行分隔符并设置doEncode=false为解码数据。这又需要另一个输入流-原始的Base64编码数据。

  3. 该流取决于您如何获取数据。理想情况下,数据应该按已InputStream解决的方式提供。如果不是,则可能必须使用ByteArrayInputStream(如果为二进制),StringBufferInputStream(如果为字符串)等。

这种逻辑大致是:

InputStream fromHadoop = ...;                                  // 3rd paragraph
Base64InputStream b64is =                                      // 2nd paragraph
    new Base64InputStream(fromHadoop, false, 80, "\n".getBytes("UTF-8"));
GZIPInputStream zis = new GZIPInputStream(b64is);              // 1st paragraph

请注意Base64InputStream(行长和行尾字节数组)的参数,您可能需要对其进行调整。



 类似资料:
  • 需要一些建议,我已经使用scala创建了一个flink作业来消费来自Kafka的消息。但是消息是用base64编码压缩的。我已经试过这个代码了 代码由于它不是有效的Json格式而失败。 然后我尝试使用SimpleStringSchema(),就像下面的代码一样 Kafka的信息完美地消耗了,但是输出如下 如何将此数据解码为有效的JSON? 此致敬意

  • 问题内容: 我有一个Base64编码的图像。用Java解码的最佳方法是什么?希望仅使用Sun Java 6附带的库 问题答案: 从v6开始,Java SE随JAXB一起提供。有静态方法可以简化这一过程。请参阅和。

  • 问题 你需要使用Base64格式解码或编码二进制数据。 解决方案 base64 模块中有两个函数 b64encode() and b64decode() 可以帮你解决这个问题。例如; >>> # Some byte data >>> s = b'hello' >>> import base64 >>> # Encode as Base64 >>> a = base64.b64encode(s)

  • 问题内容: 如何用Java解码Base64数据? 问题答案: 从v6开始,Java SE随JAXB一起提供。javax.xml.bind.DatatypeConverter有静态方法可以简化这一过程。 请参阅parseBase64Binary()和printBase64Binary()。 从Java 8开始,已经有官方支持的用于Base64编码和解码的API。随着时间的流逝,它可能会成为默认选择。

  • new String(..)转字符串的时候是怎么知道 -28, -72, -83 为一组的呢? 是字符编码有什么规则吗?( 0x**---- ,(byte) ** 是负数的就是3个字节一组这样?)

  • 介绍 Base64编码是用64(2的6次方)个ASCII字符来表示256(2的8次方)个ASCII字符,也就是三位二进制数组经过编码后变为四位的ASCII字符显示,长度比原来增加1/3。 使用 String a = "伦家是一个非常长的字符串"; //5Lym5a625piv5LiA5Liq6Z2e5bi46ZW/55qE5a2X56ym5Liy String encode = Base64.en