当前位置: 首页 > 面试题库 >

Golang中的字符串内存使用情况

况唯
2023-03-14
问题内容

我正在使用 map [string] string 优化代码,其中 map 的值仅为“ A”或“ B”。因此,我认为显然, map
[string] bool
更好,因为该地图可容纳约5000万个元素。

var a = "a"
var a2 = "Why This ultra long string take the same amount of space in memory as 'a'"
var b = true
var c map[string]string
var d map[string]bool

c["t"] = "A"
d["t"] = true

fmt.Printf("a: %T, %d\n", a, unsafe.Sizeof(a))
fmt.Printf("a2: %T, %d\n", a2, unsafe.Sizeof(a2))
fmt.Printf("b: %T, %d\n", b, unsafe.Sizeof(b))
fmt.Printf("c: %T, %d\n", c, unsafe.Sizeof(c))
fmt.Printf("d: %T, %d\n", d, unsafe.Sizeof(d))
fmt.Printf("c: %T, %d\n", c, unsafe.Sizeof(c["t"]))
fmt.Printf("d: %T, %d\n", d, unsafe.Sizeof(d["t"]))

结果是:

a: string, 8
a2: string, 8
b: bool, 1
c: map[string]string, 4
d: map[string]bool, 4
c2: map[string]string, 8
d2: map[string]bool, 1

在测试时,我发现有些奇怪,为什么带有很长字符串的 a2 使用8个字节,就像 一个 只有一个字母一样?


问题答案:

unsafe.Sizeof()不会递归地进入数据结构,它只是报告传递的值的“浅”大小。引用其文档:

该大小不包括x可能引用的任何内存。 例如,如果x是切片,则Sizeof返回切片描述符的大小,而不是该切片所引用的内存的大小。

Go中的地图被实现为指针,因此unsafe.Sizeof(somemap)将报告该指针的大小。

Go中的字符串只是包含指针和长度的标头。见reflect.StringHeader

type StringHeader struct {
        Data uintptr
        Len  int
}

因此unsafe.Sizeof(somestring)将报告上述结构的大小,该大小与string值的长度(Len字段的值)无关。

要获得映射的实际内存需求(“深度”),Go将UTF-8编码的string值的字节序列存储在内存中。内置函数len()报告a的字节长度string,因此基本上在内存中存储string值所需的内存为:

var str string = "some string"

stringSize := len(str) + unsafe.Sizeof(str)

同样不要忘记,string可以通过切片另一个更大的字符串来构造一个值,因此,即使不再引用原始字符串(因此不再需要),也仍然需要将更大的支持数组保留在内存中用于较小的字符串切片。

例如:

s := "some loooooooong string"
s2 := s[:2]

在这里,即使内存要求的s2len(s2) + unsafe.Sizeof(str) = 2 +unsafe.Sizeof(str),尽管如此,整个支持数组s将被保留。



 类似资料:
  • 我在Java中有一个包含字符串的对象。我很好奇字符串的内存使用是如何工作的。我试图优化我的程序的内存使用,应用程序将有大约10000个这样的对象。对于像“Hello World”这样的字符串,内存使用量是多少?

  • 问题内容: 我有大量的名称-值对(大约100k),我需要将它们存储在某种高速缓存(例如哈希映射)中,其中值是一个平均大小约为30k字节的字符串。 现在我知道一个事实,大量的值具有完全相同的字符串数据。为了避免多次分配相同的字符串数据,我想以某种方式重用以前分配的字符串,从而减少内存消耗。另外,这需要相当快。即,不能一一扫描所有先前分配的值。 关于如何解决此问题的任何建议? 问题答案: 千万 不能

  • 问题内容: 在下面的代码中: 为了确定从CloudFoundry接收JSON数据所需的数据类型,请测试上面的示例代码以了解vs 类型的内存分配。 类型变量的预期大小为1个字节x 4个ascii编码字母= 4个字节,但是大小显示为16个字节。 对于类型变量,GO将字符串作为字符串文字嵌入到可执行程序中。它将在运行时使用该函数将字符串文字转换为字节片。就像是… 类型变量的预期大小再次为1字节x 4 a

  • 问题内容: 我正在使用Linux,go和os /exec运行一些命令。我想知道一个进程的实时内存使用情况。这意味着我可以在启动进程后的任何时间(而不是在运行之后)随时请求内存使用情况。 (这就是为什么在回答测量使用golang可执行文件运行的内存使用量是 不是 一种选择对我来说) 例如: 我不需要非常精确的值,但是如果它的错误范围小于10兆字节,那就太好了。 有没有办法做到这一点,或者我需要某种命

  • 问题内容: 我的应用程序接受来自的指针。 例如 如何使用该指针并获取存储在该位置的值? 问题答案: 免责声明:您可能已经知道,这很危险,如果要在生产应用程序中执行此操作,则最好有一个很好的理由。话虽如此… 您需要做一些事情。这是代码,然后我们将逐步进行介绍。 您可以在Go Playground上运行它。 首先,我们需要将字符串解析为数值。在您的示例中,您给出了一个十六进制数,因此我们将以16为底进

  • 问题内容: 最好使用内置的“ go”软件包及其一些子软件包(“ go / ast”,“ go / token”,“ go / printer”等)编写输出有效的go代码的go应用程序。 要创建字符串文字表达式,您需要创建一个ast.BasicLit: 在我的go程序中,我有一个字符串,我需要创建一个ast.BasicLit,该ast.BasicLit在输出时将生成一个字符串文字,该文字将忠实地再现