Go 面试题：string 是线程安全的吗？

2023-07-20 17:04 177 0

将 脚本之家 设为“星标⭐”

第一时间收到文章更新

来源公众号：脑子进煎鱼了(ID：eddycjy)

已获得原公众号的授权转载

之前在某知名平台看到大家在交流 Go 岗位相关的面试题，其中有一道引起了大家的一些讨论，勾起被八股文的深深回忆。

面试题如下：

如标题所示，原题是：Go 中的 string 赋值是线程安全的吗？

我们可以一起先想想答案，看看中不中。

线程安全是什么

线程安全是指在多线程环境下，程序的执行能够正确地处理多个线程并发访问共享数据的情况，保证程序的正确性和可靠性。

能被称之为：线程安全，需要在多个线程同时访问共享数据时，满足如下几个条件：

不会出现数据竞争（data race）：多个线程同时对同一数据进行读写操作，导致数据不一致或未定义的行为。
不会出现死锁（deadlock）：多个线程互相等待对方释放资源而无法继续执行的情况。
不会出现饥饿（starvation）：某个线程因为资源分配不公而无法得到执行的情况。

string 线程安全

需要有一个基础了解，对于 string 类型，运行时表现对照是 StringHeader 结构体。

如下：

type StringHeader struct {
   Data uintptr
   Len  int
}

Data：存放指针，其指向具体的存储数据的内存区域。
Len：字符串的长度。

在了解前置知识后，接下来进入到实践环境。看看在 Go 里 string 类型的变量，做并发赋值到底是否线程安全。

案例一：并发访问

我们先看第一个案例，多个 goroutine 中并发访问同一个 string 变量的场景。如下代码：

package main

import (
 "fmt"
 "sync"
)

func main() {
 var wg sync.WaitGroup
 str := "脑子进煎鱼了"
 for i := 0; i < 5; i++ {
  wg.Add(1)
  go func() {
   defer wg.Done()
   fmt.Println(str)
  }()
 }
 wg.Wait()
}

输出结果：

脑子进煎鱼了
脑子进煎鱼了
脑子进煎鱼了
脑子进煎鱼了
脑子进煎鱼了

在上面的例子中，我们定义了一个 string 变量 str，然后启动了 5 个 goroutine，每个 goroutine 都会输出 str 的值。由于 str 是不可变类型，因此在多个 goroutine 中并发访问它是安全的。

可能有同学疑惑不可变类型是什么？

不可变类型，指的是一种不能被修改的数据类型，也称为值类型（value type）。不可变类型在创建后其值不能被改变，任何对它的修改操作都会返回一个新的值，而不会改变原有的值。

案例二：并发写入

第一个案例看起来没什么问题。我们再看第二个案例，针对多个 goroutine 并发写入的场景来进行验证。

如下代码：

func main() {
 var wg sync.WaitGroup
 str := "脑子进煎鱼了"
 for i := 0; i < 5; i++ {
  wg.Add(1)
  go func() {
   defer wg.Done()
   str += "！" // 修改 str 变量
   fmt.Println(str)
  }()
 }
 wg.Wait()
}

输出结果：

脑子进煎鱼了！
脑子进煎鱼了！！
脑子进煎鱼了！！！
脑子进煎鱼了！！！！
脑子进煎鱼了！！！！！

看起来没什么问题，还是正常的拼接结果，输出的顺序也完全没有问题的样子。（大雾）

我们再多运行几次。再看看输出结果：

// demo1
脑子进煎鱼了！
脑子进煎鱼了！！
脑子进煎鱼了！！！
脑子进煎鱼了！！！
脑子进煎鱼了！！！

// demo2
脑子进煎鱼了！
脑子进煎鱼了！！！
脑子进煎鱼了！！
脑子进煎鱼了！！！！！
脑子进煎鱼了！！！！

在上面的例子中，我们在每个 goroutine 中向 str 变量中添加了一个感叹号。由于多个 goroutine 同时修改了 str 变量，因此可能会出现数据竞争的情况。

我们会发现程序输出结果会出现乱序或不一致的情况，可以确认 string 类型变量在多个 goroutine 中是不安全的。

要警惕这种场景，在实际业务代码中，常有人前人留 BUG，后人因此翻车。主打一个熬夜查和修 BUG，分分钟还得洗脏数据。

string 实现线程安全

使用互斥锁

要实现 string 类型变量的线程安全，第一种方式：使用互斥锁（Mutex）来保护共享变量，确保同一时间只有一个 goroutine 可以访问它。下面是一个改造后的例子。

如下代码：

func main() {
 var wg sync.WaitGroup
 var mu sync.Mutex // 定义一个互斥锁
 str := "煎鱼"
 for i := 0; i < 5; i++ {
  wg.Add(1)
  go func() {
   defer wg.Done()
   mu.Lock() // 加锁
   str += "！"
   fmt.Println(str)
   mu.Unlock() // 解锁
  }()
 }
 wg.Wait()
}

输出结果：

煎鱼！
煎鱼！！
煎鱼！！！
煎鱼！！！！
煎鱼！！！！！

在上面的例子中，我们使用了 sync 包中的 Mutex 类型来定义一个互斥锁 mu。在每个 goroutine 中，我们先使用 mu.Lock() 方法来加锁，确保同一时间只有一个 goroutine 可以访问 str 变量。

再修改 str 变量的值并输出，最后使用 mu.Unlock() 方法来解锁，让其他 goroutine 可以继续访问 str 变量。

需要注意，互斥锁会带来一些性能上的开销，两全难齐美。

使用 atomic 包

第二种方案是使用 atomic 包来实现原子操作，如下代码：

func main() {
 var wg sync.WaitGroup
 var str atomic.Value // 定义一个原子变量
 str.Store("hello, world")
 for i := 0; i < 5; i++ {
  wg.Add(1)
  go func() {
   defer wg.Done()
   oldStr := str.Load().(string) // 读取原子变量的值
   newStr := oldStr + "!"
   str.Store(newStr) // 写入原子变量的值
   fmt.Println(newStr)
  }()
 }
 wg.Wait()
}