C++中的左值与右值

优质

小牛编辑

138浏览

2023-12-01

说明

这一部分内容只是帮助理解 C++(11) 中左值与右值的概念。
在编程实践中，因为编译器优化的存在，特别是其中的返回值优化（Return Value Optimization, RVO）使你不需要额外关注左值与右值的区别，像 C++(03) 一样编程即可。
C++11 rvalues and move semantics confusion (return statement) - Stack Overflow
除非你在进行库的开发，特别是涉及模板元编程等内容时，需要实现移动构造函数（move constructor），或者完美转发

小结

左值引用类型与右值引用类型

T   t1;         // 类型 T
T&  t2 = t1;    // T&  表示 T 的左值引用类型，t2 是左值引用类型的变量，它引用的是一个左值
T&& t3 = T();   // T&& 表示 T 的右值引用类型，t3 是右值引用类型的变量，它引用的是一个右值

T&  t4 = T();   // err: 左值引用 不能绑定一个 右值
T&& t5 = t1;    // err: 右值引用 不能绑定一个 左值

const T& t6 = t1;   // const T& 表示 T 的常量（左值）引用
const T& t7 = T();  // 常量引用类型是“万能”的引用类型

// 不能把 常量类型 绑定到 非常量引用类型 上
T&& t8 = t6;        // err: 不能把常量类型绑定到 右值引用类型
T&  t9 = t6;        // err: 也不能把常量类型绑定到 左值引用类型

这里的变量 t1~t9 都是左值，因为它们都有名字

当发生自动类型推断时，`T&&` 也能绑定左值

template<typename T>    // 模板元编程
void foo(T&& t) { }     // 此时 T&& 不是右值引用类型，而是未定引用类型

void bar(int&& v) { }   // 非模板编程，int&& 是明确的右值引用类型

foo(10);        // OK: 未定引用类型 t 绑定了一个右值
bar(10);        // OK: 右值引用类型 v 绑定了一个右值

int x = 10;
foo(x);         // OK:  未定引用类型 t 绑定了一个左值
bar(x);         // err: 右值引用类型 v 不能绑定一个左值

int&&  p = x;   // err
auto&& t = x;   // OK

此时，T&& 就不再是右值引用类型，而是未定引用类型

如何快速判断左值与右值

能被 & 取地址的就是左值

int foo;               // foo 是一个左值
cout << &foo;          // 可以被取地址
foo = foo + 5;         // foo + 5 是一个左值
cout << &(foo+5);      // err
cout << &1;            // err

多数常数、字符等字面量都是右值，但字符串是左值
虽然字符串字面量是左值；但它是 const 左值（只读对象），所以也不能对它赋值
```
cout << &'a';     // err: lvalue required as unary '&' operand
cout << &"abc";   // OK, 可以对字符串取地址
"abc" = "cba";    // err: assignment of read-only location
```
为什么字符串字面量是对象？——节省内存，同一份字符串字面量引用的是同一块内存

所有的具名变量或对象都是左值，而匿名变量/临时变量则是右值
- 匿名变量/临时变量的特点是表达式结束后就销毁了
```
int i = 5;               // int 型字面量
auto f = []{return 5;};  // lambda 表达式
```

引用折叠规则

所有的右值引用叠加到右值引用上仍然还是一个右值引用。（T&& && 变成 T&&）
所有的其他引用类型之间的叠加都将变成左值引用。（T& &, T& &&, T&& & 都变成 T&）
对常量引用规则一致

示例

typedef int &  lRef;
typedef int && rRef;

typedef const int &  lcRef;
typedef const int && rcRef;

int main() {
    int a = 10;

    // 左值引用
    lRef    b = a;    // T&
    lRef &  c = a;    // T& &
    lRef && d = a;    // T& &&
    rRef &  e = a;    // T&& &

    // 右值引用
    rRef    f = 10;   // T&&   
    rRef && g = 10;   // T&& &&

    // 左值引用
    lcRef     b2 = a;    // const T& 
    lcRef &   c2 = a;    // const T& &
    lcRef &&  d2 = a;    // const T& &&
    rcRef &   e2 = a;    // const T&& & 

    // 右值引用
    rcRef     f2 = 10;   // const T&&
    rcRef &&  g2 = 10;   // const T&& &&

    return 0;
}

`move()` 与 `forward()`

move() 的主要作用是将一个左值转为 xvalue（右值）, 其实现本质上是一个 static_cast<T>
forward() 主要用于实现完美转发，其作用是将一个类型为（左值/右值）引用的左值，转化为它的类型所对应的值类型（左值/右值）
觉得难以理解的话，就继续看下去吧

左值与右值的本质

左值表示是“对象”（object），右值表示“值”（value）——“对象”内存储着“值”
左值 -> 右值的转换可看做“读取对象的值”（reading the value of an object）
其他说法：
- 左值是可以作为内存单元地址的值；右值是可以作为内存单元内容的值
- 左值是内存中持续存储数据的一个地址；右值是临时表达式结果

左值、消亡值、纯右值

C++11 开始，表达式一般分为三类：左值（lvalue）、消亡值（xvalue）和纯右值（prvalue）；
其中左值和消亡值统称泛左值（glvalue）；
消亡值和纯右值统称右值（rvalue）。

右值引用的特点

右值引用延长了临时对象的生命周期

int i = getI();  // getI() 会返回一个 int 型的临时变量
T&& t = getT();  // t 是一个右值引用
                  // getT() 同样返回一个临时变量，但是该临时变量被“引用”了
                  // 因此生命周期得到了延长

getI() 和 getT() 都返回一个临时变量，但是 getT() 产生的临时变量不会在表达式结束后就马上销毁，而是会被“续命”——它的声明周期将和它的引用类型变量 t 一样长。

利用右值引用避免临时对象的拷贝和析构

  int g_constructCount=0;
  int g_copyConstructCount=0;
  int g_destructCount=0;

  struct A {
      A(){              // 基本构造
          cout<<"construct: "<<++g_constructCount<<endl;    
      }

      A(const A& a) {   // 拷贝构造
          cout<<"copy construct: "<<++g_copyConstructCount <<endl;
      }

      ~A() {            // 析构
          cout<<"destruct: "<<++g_destructCount<<endl;
      }
  };

  A getA() {
      A a;            // 第一次构造
      return a;
      // return A();  // 等价，分开写是为了便于说明
  }

  int main() {
      A a2 = getA();    // 非右值引用
      A&& a3 = getA();  // 右值引用
      return 0;
  }

非右值引用，关闭返回值优化

construct: 1        // 第一次构造，getA() 中的局部变量 a
copy construct: 1   // 第二次构造，将 a 复制给一个临时变量
destruct: 1           // 析构局部变量 a
copy construct: 2   // 第三次构造，将临时变量复制给 a2
destruct: 2           // 析构临时变量
destruct: 3           // 程序结束，析构变量 a2

右值引用，关闭返回值优化

construct: 1        // 第一次构造，getA() 中的局部变量 a
copy construct: 1   // 第二次构造，将 a 复制给一个临时变量
                    // 右值引用 a3 延长了临时变量的声明周期，使其没有马上被析构
destruct: 1           // 析构局部变量 a
destruct: 2           // 程序结束，析构变量 a3

利用常量引用也能避免临时对象的拷贝与析构 -> 常量（左值）引用
返回值优化做的更彻底 -> 返回值优化 RVO

右值引用类型绑定的一定是右值，但 `T&&` 可能不是右值引用类型

int&& v1 = 1;   // OK: v1 是右值引用类型，且 1 是右值
int&& v2 = v1;  // err: v2 是右值引用类型，但 v1 是左值

当发生自动类型推断时，`T&&` 是未定的引用类型

T&& t 在发生自动类型推断时，是未定的引用类型
- 比如模板元编程，auto 关键字等
- 如果 t 被一个左值初始化，它就是一个左值；如果 t 被一个右值初始化，它就是一个右值
```
template<typename T>    // 模板元编程
void foo(T&& t) { }     // 此时 T&& 不是右值引用类型，而是未定引用类型
```
foo(10); // OK: 未定引用类型 t 绑定了一个右值
int x = 10; foo(x); // OK: 未定引用类型 t 绑定了一个左值
int&& p = x; // err auto&& t = x; // OK

仅当发生自动类型推导时（模板编程，auto 关键字），T&& 才是未定引用类型

void bar(int&& v) { }   // 非模板编程，int&& 是明确的右值引用类型

bar(10);        // OK: 右值引用类型 v 绑定了一个右值

int x = 10;
bar(x);         // err: 右值引用类型 v 不能绑定一个左值

常量（左值）引用

右值引用是 C++11 引入的概念
在 C++11 前，是如何避免临时对象的拷贝和析构呢？——利用常量左值引用
```
const A& a = getA();  // OK: 常量左值引用可以接受右值
```
常量左值引用是一个“万能”的引用类型，可以接受左值、右值、常量左值和常量右值

普通的左值引用不能接受右值

A& a = getA();        // err: 非常量左值引用只能接受左值

返回值优化 RVO

利用右值引用可以避免临时对象的拷贝可析构

但编译器的返回值优化（Return Value Optimization, RVO）做得“更绝”，直接回避了所有拷贝构造

int g_constructCount=0;
int g_copyConstructCount=0;
int g_destructCount=0;

struct A {
    A(){              // 基本构造
        cout<<"construct: "<<++g_constructCount<<endl;    
    }

    A(const A& a) {   // 拷贝构造
        cout<<"copy construct: "<<++g_copyConstructCount <<endl;
    }

    ~A() {            // 析构
        cout<<"destruct: "<<++g_destructCount<<endl;
    }
};

A getA() {
    A a;            // 第一次构造
    return a;
    // return A();  // 等价，分开写是为了便于说明
}

int main() {
    A aa = getA();    // 第二次构造：把 a 复制给一个临时变量，
                      // 第三次构造：把临时变量复制给 aa
                      // 开启优化后，相当于直接把 a “改名”成 aa 了，所以只有一次构造
    return 0;
}

关闭编译器优化的结果

construct: 1        // 第一次构造，getA() 中的局部变量 a    
copy construct: 1   // 第二次构造，将 a 复制给一个临时变量
destruct: 1           // 析构局部变量 a
copy construct: 2   // 第三次构造，将临时变量复制给 aa
destruct: 2           // 析构临时变量
destruct: 3           // 程序结束，析构变量 aa

开启编译器优化

construct: 1        // 构造局部变量 a，在编译的优化下，相当于直接将 a “改名” aa
destruct: 1         // 程序结束，析构变量 aa

返回值优化并不是 C++ 的标准，是各编译器优化的结果，但是这项优化并不复杂，所以基本流行的编译器都提供

移动语义

深拷贝带来的问题

带有堆内存的类，必须提供一个深拷贝构造函数，以避免“指针悬挂”问题

所谓指针悬挂，指的是两个对象内部的成员指针变量指向了同一块地址，析构时这块内存会因被删除两次而发生错误
class A {
public:
A(): m_ptr(new int(0)) {                  // new 堆内存
cout << "construct" << endl;
}

  A(const A& a):m_ptr(new int(*a.m_ptr)) {  // 深拷贝构造函数
      cout << "copy construct" << endl;
  }

  ~A(){
      // cout << "destruct" << endl;
      delete m_ptr;   // 析构函数，释放堆内存的资源
  }

private: int* m_ptr; // 成员指针变量 };

A getA() { return A(); }

int main() { A a = getA(); return 0; }

  - 输出（关闭 RVO）
  ```Cpp
  construct
  copy construct
  copy construct

如果不关闭 RVO，只会输出 construct

提供深拷贝能够保证程序的正确性，但会带来额外的性能损耗——临时对象也会申请一块内存，然后又马上被销毁了；如果堆内存很大的话，这个性能损耗是不可忽略的
对于临时对象而言，深拷贝不是必须的
利用右值引用可以避免无谓的深拷贝——移动拷贝构造函数

移动构造函数

相比上面的代码，这里只多了一个移动构造函数——一般会同时提供拷贝构造与移动构造

class A {
public:
    A(): m_ptr(new int(0)) {                    // new 堆内存
        cout << "construct" << endl;
    }

    A(const A& a): m_ptr(new int(*a.m_ptr)) {   // 深拷贝构造函数
        cout << "copy construct" << endl;
    }

    A(A&& a): m_ptr(a.m_ptr) {                  // 移动构造函数
        a.m_ptr = nullptr;      // 把参数对象的指针指向 nullptr
        cout << "move construct" << endl;
    }

    ~A(){
        // cout << "destruct" << endl;
        delete m_ptr;   // 析构函数，释放堆内存的资源
    }
private:
    int* m_ptr;         // 成员指针变量
};

A getA() {
    return A();
}

int main() {
    A a = getA();
    return 0;
}

输出（关闭返回值优化）

construct
move construct        // 没有调用深拷贝，值调用了移动构造函数
move construct

如果不关闭 RVO，只会输出 construct

这里没有自动类型推断，所以 A&& 一定是右值引用类型，因此所有临时对象（右值）会匹配到这个构造函数，而不会调用深拷贝
对于临时对象而言，没有必要调用深拷贝
这就是所谓的移动语义——右值引用的一个重要目的就是为了支持移动语义

移动语义与 `move()`

移动语义是通过右值引用来匹配临时值，从而避免深拷贝

利用 move() 方法，可以将普通的左值转化为右值来达到避免深拷贝的目的

class A {
public:
    A(): m_ptr(new int(0)) {                    // new 堆内存
        cout << "construct" << endl;
    }

    A(const A& a): m_ptr(new int(*a.m_ptr)) {   // 深拷贝构造函数
        cout << "copy construct" << endl;
    }

    A(A&& a): m_ptr(a.m_ptr) {                  // 移动构造函数
        //a.m_ptr = nullptr;      // 为了实验，这里没有把参数对象的指针指向 nullptr
        cout << "move construct" << endl;
    }

    ~A(){
        // cout << "destruct" << endl;
        delete m_ptr;   // 析构函数，释放堆内存的资源
    }

    int get_data() {
        return *m_ptr;
    }

    void set_data(int v) {
        *m_ptr = v;
    }
private:
    int* m_ptr;         // 成员指针变量
};

int main() {
    A a1;                                 // construct
    a1.set_data(1);
    cout << a1.get_data() << endl;  // 1

    A a2 = a1;                            // copy construct
    cout << a2.get_data() << endl;  // 1
    a2.set_data(2);
    cout << a2.get_data() << endl;  // 2
    cout << a1.get_data() << endl;  // 1

    A a3 = move(a1);                      // move construct
    a3.set_data(3);
    cout << a3.get_data() << endl;  // 3
    cout << a1.get_data() << endl;  // 3: 因为没有深拷贝，指向的是同一块地址
    return 0;
}

运行结果

construct
1
copy construct
1
2
1
move construct
3
3

STL 容器的移动语义

{
    list<string> tokens;
    //省略初始化...
    list<string> t = tokens;    // 这里存在深拷贝 
}
list<string> tokens;
list<string> t = move(tokens);  // 这里没有深拷贝

C++11 中所有的容器都实现了移动语义

`move()` 的本质

move() 实际上并没有移动任何东西，它唯一的功能是将一个左值强制转换为一个右值引用
如果没有对应的移动构造函数，那么使用 move() 仍会发生深拷贝，比如基本类型，定长数组等
因此，move() 对于含有资源（堆内存或句柄）的对象来说更有意义。

`move()` 的原型 TODO

c++11 中的 move 与 forward - twoon - 博客园

完美转发

右值引用的引入，使函数可以根据值的类型（左值或右值）进行不同的处理
于是又引入了一个问题——如何正确的传递参数，保持参数作为左值或右值的特性

转发失败的例子：

void processValue(int& a)  { cout << "lvalue" << endl; }
void processValue(int&& a) { cout << "rvalue" << endl; }

template <typename T>
void forwardValue(T&& val) {
    processValue(val);      // 因为 val 本身是一个左值
                            // 所以无论 val 是左值引用类型还是右值引用类型的变量
                            // 都只会调用 processValue(int& a)
}

int main() {
    int i = 1;
    forwardValue(i);    // 传入一个左值
                        // val 会被推断为是一个左值引用类型

    forwardValue(1);    // 传入一个右值
                        // 虽然 val 会被推断为是一个右值引用类型，但它本身是一个左值
    return 0;
}

输出
```
lvalue
lvalue
```
无论传入的是左值还是右值，val 都是一个左值

`forward<T>()` 实现完美转发

这里写的不够详细，有时间在整理
在函数模板中，T&& 实际上是未定引用类型，它是可以得知传入的对象是左值还是右值的
这个特性使其可以成为一个参数的路由，利用 forward() 实现完美转发
std::forward<T>() 可以保留表达式作为“对象”（左值）或“值”（右值）的特性<!-- ```Cpp int&& a = 1;

cout << &a; // OK: 虽然 a 是一个右值引用类型的变量，但它本身是一个左值 cout << &forward(a); // err: taking address of xvalue (rvalue reference)

- 利用 `std::forward<T>()` 实现完美转发：
  > 不可以用变量接收 `forward<T>()` 的返回值，因为所有具名变量都是左值
  ```Cpp
  void processValue(int& a)  { cout << "lvalue" << endl; }
  void processValue(int&& a) { cout << "rvalue" << endl; }

  template <typename T>
  void forwardValue(T&& val) {
      processValue(forward<T>(val));   // 利用 forward 保持对象的左右值特性

      // 必须把 forward<T>(val) 打包作为参数，否则都达不到完美转发的目的
      // auto v = forward<T>(val);
      // processValue(v);

      // auto&& v = forward<T>(val);
      // processValue(v);
  }

  int main() {
      int i = 1;
      forwardValue(i);    // 传入一个左值

      forwardValue(1);    // 传入一个右值
      return 0;
  }

输出
```
lvalue
rvalue
```
正确实现了转发

`forward<T>()`的原型 TODO

Reference

The lvalue/rvalue metaphor — Joseph Mansfield
关于C++左值和右值区别有没有什么简单明了的规则可以一眼辨别？ - 知乎
从4行代码看右值引用 - qicosmos(江南) - 博客园
c++11 中的 move 与 forward - twoon - 博客园
左值右值的一点总结 - twoon - 博客园