当前位置: 首页 > 面试题库 >

在Go中加速JSON解析

储俊英
2023-03-14
问题内容

我们有事务日志文件,其中每个事务都是JSON格式的一行。我们经常需要获取数据的选定部分,执行一次时间转换,然后以特定格式将结果馈送到另一个系统中。我编写了一个Python脚本,可以根据需要html" target="_blank">执行此操作,但是我希望Go可以更快,并且可以给我一个开始学习Go的机会。因此,我写了以下内容:

package main
import "encoding/json"
import "fmt"
import "time"
import "bufio"
import "os"

func main() {

    sep := ","

    reader := bufio.NewReader(os.Stdin)

    for {
        data, _ := reader.ReadString('\n')
        byt := []byte(data)

        var dat map[string]interface{}

        if err := json.Unmarshal(byt, &dat); err != nil {
            break
        }

        status := dat["status"].(string)
        a_status := dat["a_status"].(string)
        method := dat["method"].(string)
        path := dat["path"].(string)
        element_uid := dat["element_uid"].(string)
        time_local := dat["time_local"].(string)
        etime, _ := time.Parse("[02/Jan/2006:15:04:05 -0700]", time_local)
        fmt.Print(status, sep, a_status, sep, method, sep, path, sep, element_uid, sep, etime.Unix(), "\n")
    }
}

编译时没有任何抱怨,但是令我惊讶的是缺乏性能改进。为了进行测试,我将2,000,000行日志放入tmpfs(以确保磁盘I /
O不受限制),并比较了脚本的两个版本。我的结果:

$ time cat /mnt/ramdisk/logfile | ./stdin_conv > /dev/null 
real    0m51.995s

$ time cat /mnt/ramdisk/logfile | ./stdin_conv.py > /dev/null 
real    0m52.471s

$ time cat /mnt/ramdisk/logfile > /dev/null 
real    0m0.149s

如何使其更快?我做了一些初步的努力。例如,ffjson项目提议创建静态函数,这些函数不需要反射。但是,到目前为止,我无法使它正常工作,并出现以下错误:

Error: Go Run Failed for: /tmp/ffjson-inception810284909.go
STDOUT:

STDERR:
/tmp/ffjson-inception810284909.go:9:2: import "json_parse" is a program, not an importable package

:

此外,我上面所说的不是静态类型吗?可能不是-
我正积极地向Go滴下耳朵。我尝试有选择地禁用Go代码中的不同属性,以查看是否特别有问题。没有一个对性能有明显的影响。关于提高性能的任何建议,还是仅仅是编译后的语言没有比其他语言有实质性好处的情况?


问题答案:

尝试使用类型来删除所有这些不必要的分配和类型断言。

type RenameMe struct {
     Status string `json:"status"`
     Astatus string `json:"a_status"`
     Method string `json:"method"`
     Path string `json:"path"`
     ElementUid string `json:"element_uid"`
     TimeLocal time.Time `json:"time_local"`
     Etime time.Time // deal with this after the fact
}

data := &RenameMe{}
if err := json.Unmarshal(byt, data); err != nil {
            break
        }

data.Etime,  _ := time.Parse("[02/Jan/2006:15:04:05 -0700]", time_local)

我不会对其进行测试以确保其性能优于您的代码,但我敢肯定它会在很大程度上提高性能。试试看,让我知道。



 类似资料:
  • 问题内容: 使用该包可以很容易地解析如下对象。 我面临的问题是从服务器返回多个命令,如下所示: 无法使用以下代码进行解析。 我正在尝试解析Common Crawl数据(请参阅示例)。 我怎样才能做到这一点? 问题答案: 假设您的输入确实是一系列有效的JSON文档,请使用json.Decoder对其进行解码: 游乐场:https://play.golang.org/p/ANx8MoMC0yq 如果您

  • 问题内容: 我正在Go中处理一个json POST,其中包含一个包含64位整数的对象数组。当使用json.Unmarshal时,这些值似乎被转换为float64,并不是很有用。 有什么办法可以在json.Unmarshal的输出中保留原始的int64? 转到上面代码的游乐场 问题答案: 解决方案1 您可以使用Decoder和UseNumber解码您的号码而不会丢失: 该类型的定义如下: 这意味着您

  • 问题内容: 我正在使用JSON,它返回三种不同的对象类型“项目”,“类别”和“修饰符”。可以在此处查看JSON的示例。我为三种类型的对象创建了模型。但是当我解组时,我选择了一种类型来解组整个JSON。(我知道这不可能是正确的方法…)然后,我尝试根据不同的类型来解析不同的项目,如json字段“类型”,然后将该对象附加到适当类型的切片中。我遇到错误,因为我不知道如何解组其中具有不同字段且具有不同类型的

  • 问题内容: 我正在尝试在Go中解析json流。我创建了一个简化的示例: 这会给我 我在sql包中发现了一个可为null的int64 ,但是json似乎无法处理它。 json是否可以处理可为null的int64类型?如果可能的话,我会对将JSON null 转换为-1或MinValue 感到满意。 谢谢您的投入,Fabian 问题答案: 只需使用一个。指针可以为nil,也可以指向具有关联值的int6

  • 问题内容: 我是Go的新手,现在遇到了问题。我有一个称为Message的类型,它是这样的结构: 我也有一个名为CreateMessage的类型,如下所示: 我有一个像的JSON字符串。 当我用来将其解码为Message变量时,答案是。 因此,我可以将JSON解码为Message结构并更改其Data的接口{}以根据Cmd键入CreateMessage吗? 我试图将Data直接转换为CreateMes

  • 问题内容: 我想解析一些json数据。数据如下所示: {“ id”:“ someId”,“ key_1”:“ value_1”,“ key_2”:“ value_2”,“ key_3”:“ value_3”,“点数”:[[1487100466412,“ 50.032178”,“ 8.526018”,300 ,0.0,26,0],[1487100471563,“ 50.030869”,“ 8.525