编译器如何实现lambda表达式?

2021-07-09 16:05:26 浏览数 (1)

lambda表达式在C 11中引入,用lambda表达式表示匿名函数非常方便,语法很简单,而且可以使代码更紧凑,更易于阅读。

lambda表达式更适合定义小点的回调内联去传递给其他函数,而不是在其他地方定义个完整的函数对象,并在其重载函数调用运算符中实现回调逻辑。所有的逻辑都在一个位置上,容易理解和维护,lambda表达式可以接收参数,可返回值,可模板化,可通过值或引用的方式访问外面的变量,相当的灵活。

关于lambda表达式的使用,我之前介绍过,可以看这篇文章搞定c 11新特性std::function和lambda表达式,这里一笔带过:

代码语言:javascript复制
auto lambda { []{ cout << "Hello n"; } };
lambda();

那这个lambda表达式是如何实现的呢?

编译器会将lambda表达式自动转换为函数对象,编译器会为此生成个唯一的命名。上面的示例会自动的转换成下面这样的函数对象,注意函数调用运算符是个const方法,返回类型是auto,这方便编译器根据方法体自动推导出返回类型。

代码语言:javascript复制
class CompilerGeneratedName {
    public:
        auto operator()() const { cout << "Hello n"; }
};

编译器生成的lambda闭包名字会是一些奇怪的名子,例如__Lambda_21Za等,我们没法知道这个名字,我们也不需要知道这个名字。

lambda表达式可以接收参数,参数在圆括号之间指定,就像普通函数一样,下面是例子:

代码语言:javascript复制
auto lambda {
    [](int value){ cout << "The value is " << value << endl; } };
lambda(42);

如果lambda表达式不接收任何参数,可以指定空括号或者直接省略括号。

编译器会将上面的lambda表达式自动转换为下面这样:

代码语言:javascript复制
class CompilerGeneratedName {
    public:
        auto operator()(int value) const {
            cout << "The value is " << value << endl; }
};

lambda表达式可以返回值,返回类型在箭头后面指定,称为尾返回类型,看代码:

代码语言:javascript复制
auto lambda { [](int a, int b) -> { return a   b; } };
int sum = lambda(11, 22);

编译器转成这样:

代码语言:javascript复制
class CompilerGeneratedName {
    public:
        auto operator()(int a, int b) const { return a   b; }
};

那能捕获变量的lambda表达式是怎么实现的呢?

比如下面的lambda表达式:

代码语言:javascript复制
double data { 1.234 };
auto lambda { [data]{ cout << "Data = " << data << endl; } }

捕获的变量会变为lambda闭包的数据成员,值捕获的变量被拷贝到仿函数的数据成员中,编译器的行为是这样:

代码语言:javascript复制
class CompilerGeneratedName
{
    public:
        CompilerGeneratedName(const double& d) : data { d } {}
        auto operator()() const { cout << "Data = " << data << endl; }
    private:
        double data;
};

还有泛型lambda表达式:

代码语言:javascript复制
auto areEqual { [](const auto& value1, const auto& value2) {
    return value1 == value2; } };

vector values1 { 2, 5, 6, 9, 10, 1, 1 };
vector values2 { 4, 4, 2, 9, 0, 3, 1 };
findMatches(values1, values2, areEqual, printMatch);

编译器会转换成这样:

代码语言:javascript复制
class CompilerGeneratedName {
    public:
        template <typename T1, typename T2>
        auto operator()(const T1& value1, const T2& value2) const
{ return value1 == value2; }
};

如果findMatches()函数中的参数是其他类型,那么areEqual泛型表达式不需要任何更改就可以直接继续使用。

聊完了编译器怎么实现的lambda表达式,下面介绍下lambda表达式的捕获方式。

捕获方式

有两种方法从闭包作用域捕获所有变量,称为默认捕获:

  • [=] 值捕获所有变量
  • [&]引用捕获所有变量
  • 注意:
  • 使用引用方式捕获变量时,必须确保引用在lambda表达式执行期间是合法的。
  • 当使用默认捕获时,通过值(=)或引用(&),只有那些在lambda 表达式中真正使用的变量才会被捕获,未使用的变量不会被捕获。
  • 不建议使用默认捕获,即使默认捕获只捕获那些在lambda 表达式主体中真正使用的变量,通过使用=默认捕获,可能会意外的导致高代价的拷贝,通过使用&默认捕获,可能意外的在闭包作用域中修改变量,建议明确指定想要捕获哪些变量以及捕获方式。

再注意:全局变量总是通过引用捕获,例如在下面的代码中,默认捕获用于按值捕获所有内容,然而全局变量global其实是通过引用捕获的,在执行lambda 后它的值被更改。

代码语言:javascript复制
int global { 42 };
int main() {
    auto lambda { [=] { global = 2; } };
    lambda();
    // 这里global是2!
}

不允许像下面这样显式捕获全局变量,这样编译会失败:

代码语言:javascript复制
auto lambda { [global] { global = 2; } }; // error

所以,建议不要使用全局变量。

对于不捕获任何内容的lambda表达式,编译器自动提供转换运算符,将lambda 表达式转换为函数指针。这样的lambda表达式可作为参数传递给其他函数。

在C 20中关于lambda表达式也做了一些更新,可以模板化lambda表达式,也可以默认构造、拷贝和赋值lambda表达式,像下面这样:

代码语言:javascript复制
auto lambda { [](int a, int b) { return a   b; } };
decltype(lambda) lambda2; // 默认构造
auto copy { lambda }; // 拷贝构造
copy = lambda2; // 拷贝赋值

这不是本文的主题,就不过多介绍了。

关于lambda表达式的内容,打完收工!

0 人点赞