我也浅谈【泛型参数】的【晚·绑定late bound
】
名词解释
为了减少对正文内容理解的歧义,我们先统一若干术语的名词解释:
- 泛型项:
- 要么,泛型函数
generic function
; - 要么,泛型类型
generic type
(比如,泛型结构体)。
- 要么,泛型函数
- 泛型参数:
- 要么,泛型·类型·参数
generic type parameter
; - 要么,泛型·生命周期·参数
generic lifetime parameter
。
- 要么,泛型·类型·参数
- 泛型参数限定条件: 见下图吧,实在不容易文字描述
- 高阶·生命周期·限定条件
higher-ranked lifetime bounds
:
FST
:Fixed Size Type
【泛型参数】的【绑定】是【编译时】概念
首先,无论是【早·绑定】还是【晚·绑定】,【泛型参数-绑定】都是发生在编译阶段,而不是运行期间。
- 只不过【泛型参数·早·绑定】是发生在【单态化
monomorphize
】过程中的【泛型项】定义位置。 - 而【泛型参数·晚·绑定】是发生在【单态化
monomorphize
】之后的【泛型项】调用位置(比如,函数调用)。
所以,【泛型参数】的【早/晚·绑定】是一个纯编译时概念,还是馁馁的【编译时-抽象】和零运行时(抽象)成本。
区分【泛型参数·早/晚·绑定】的标准
其次,区分【泛型参数】是【早·绑定】还是【晚·绑定】的标准就是
- 若在【
rustc
单态化monomorphize
】期间,就能推断出【泛型参数】具体“值”,那么该【泛型参数】就是【早·绑定】。 - 若在【
rustc
单态化monomorphize
】之后,还需评估【泛型项】的调用方式,才能确定【泛型参数】具体“值”,那么该【泛型参数】就是【晚·绑定】。
推断【泛型参数】绑定值的方式
接着,被【早·绑定】的【泛型参数】
- 既可·由编译器自动推断 [例程1]
- 也可·徒手编写
TurboFish
调用语句显示地指定 [例程1]
再次,被【晚·绑定】的【泛型参数】
- 仅能·由编译器自动推断 [例程3]
- 不可·由
TurboFish
调用语句显示地指定 [例程2]
【泛型参数 - 晚·绑定】不支持TurboFish
语法
原因是【TurboFish
调用语句·展开】与【泛型参数 - 晚·绑定】有两项不同:
- 第一,执行时间点不同
TurboFish
调用语句是在【单态化monomorphize
】过程中被展开的。- 【泛型参数 - 晚·绑定】则是发生在【单态化
monomorphize
】之后。此时,TurboFish
调用语句的源码已经不存在了(— 之前已经被展开了)。
- 第二,执行位置不同
- 【已知项】:函数的引用类型【实参】的生命周期
- 【未知项】:函数的引用类型【返回值】的生命周期
- 有点抽象,那举个例子:展开【泛型项】调用位置上的
let array = iterator.collect::<Vec<u8>>();
语句会导致,在【单态化monomorphize
】之后,在Iterator::collect()
成员方法的定义位置多出来一个fn collect(self) -> Vec<u8>
的新成员方法定义。由此可见,最终的修改项还是落在了【泛型项】定义位置的codegen
代码上。 - 由此得出一个结论:
TurboFish
语法调用语句·等同于·【泛型参数 - 早·绑定】 - 编译器对
TurboFish
调用语句的【展开】处理会回过头来对【泛型项】定义位置的代码产生影响。即,【单态化】会生成更多的代码 — 这类由编译器生成的代码被称为codegen
。 - 而由【泛型参数·晚·绑定】确定【泛型参数】【实参】并不会导致在【泛型项】定义位置有新的
codegen
被生成。这是一个纯“调用位置”的,由【已知项】推断【未知项】的行为。其中,
通用规则
先直接记结论吧。以后,再慢慢体会底层逻辑。
- 【泛型·类型·参数】都是【早·绑定】的。例如,在给【函数指针】赋值前,必须先明确【泛型·类型·参数】的具体“值”。 fn m<T>() {}let m1 = m::<u8>; // 赋值函数指针,得先确定泛型类型参数`T`的实参值`u8`。m1(); // 经由【函数指针】调用函数就没有机会再显示地指定【泛型参数】值了。
- 【泛型函数】的【泛型·生命周期·参数】都是【晚·绑定】,
- 【泛型函数】是一个【成员方法】且引用了由其所属【泛型类型】(比如,结构体)声明的另一个【泛型·生命周期·参数】(有点绕儿,看 [例程3])。于是,该【泛型函数】使用的这个【生命周期·参数】就是【早·绑定】的。
lifetime bound
出现。即,【泛型·生命周期·参数】正被另一个【泛型·生命周期·参数】所限定(比如,<'a, 'b> where 'a: 'b
)。有点绕儿,看 [例程4]。于是,该【泛型函数】的这两个【泛型·生命周期·参数】(限定的·与·被限定的)皆都是【早·绑定】。- 要么,忽略【泛型·生命周期·参数】的存在。别说你没写过这样的代码,可能仅只是没有认真思考为什么可以这样。 fn m<'a>(name: &'a str) -> &'a str {name}let m1 = m; // 'a 的生命周期参数被直接无视了。let r = m1("test"); // 函数被调用了才知道其实参的`lifetime`是`static` // 和其返回值的`lifetime`也是`static`
- 要么,使用【高阶·生命周期·限定条件
higher-ranked lifetime bounds
】显示地标注待定的【泛型·生命周期·参数】 fn m<'a>(name: &'a str) -> &'a str {name}// `for<'a>`语法表示`'a`生命周期参数的实参待定。let m1: for<'a> fn(&'a str) -> &'a str = m; // 函数指针写法let r = m1("test"); // 函数被调用了才知道其实参的`lifetime`是`static` // 和其返回值的`lifetime`也是`static`// 对于不嫌麻烦的你,没准【闭包`trait`写法】也是一个选择。let m2: Box<dyn for<'a> Fn(&'a str) -> &'a str> = Box::new(m);let r = m2("test"); - 因为函数不被调用,就不知其【实参】的真实生命周期。而【泛型函数】【生命周期·参数】的关键作用就是以【实参】生命周期为“已知量",推断【返回值】生命周期的"未知量"。特别是,当一个函数同时有多个·引用类型·形参输入和·引用类型·返回值输出时,【泛型·生命周期·参数】就必须被声明和使用,否则编译错误。
- 在【函数指针】赋值中,
- 两个【早·绑定】的例外
- 【泛型类型】的【泛型·生命周期·参数】都是【早·绑定】,
- 【泛型类型】的【泛型参数】声明包含了【高阶·生命周期·限定条件
higher-ranked lifetime bound
】 [例程5]。 - 因为明确了类型,也就明确了如何实例化该类型。而【泛型类型】【生命周期·参数】的关键作用就是以该类型【实例】的生命周期为“已知量”,推断它的·引用类型·字段值生命周期的“未知量”。
- 一个【晚·绑定】的例外
- 【泛型类型】的【泛型参数】声明包含了【高阶·生命周期·限定条件
写在最后的补充
- 没有【限定条件】的【泛型参数】,编译器会自动给其安排缺省
bound
:- 就【泛型·类型·参数】而言,编译器会自动给该【泛型参数】添加
Sized
缺省trait bound
。即,<T: Sized>
。所以,【泛型·类型·参数】一定都是FST
的。 - 就【泛型
lifetime
参数】而言,编译器会认为该【泛型参数】生存期 >= 【泛型项】生存期。
- 就【泛型·类型·参数】而言,编译器会自动给该【泛型参数】添加
- 【生命周期】参数也是【泛型参数】。
我总结了lifetime bound
限定条件的四句实用口诀
- 左长,右短 — 被限定项总比限定项更能“活”
<'a, 'b> where 'a: 'b
则有'a >= 'b
- 留长,返短 — 函数【引用类型·返回值】的生命周期总是对齐”最短命“【入参】的生命周期 [例程6]
fn test<'a, 'b>(a: &'a str, b: &'b str) -> &'b str where 'a: 'b
- 内长,外短 — 引用的引用。越是外层的引用,其生命周期就越短
<'a, 'b> where 'a: 'b
则有&'b &'a i32
。而,&'a &'b i32
会导致编译错误。 'static
最”命长“ — 它馁馁地命长于任何被显示声明的生命周期参数'a
。
至此,我已经倾其所有领会内容。希望对读者理解【泛型参数 - 绑定】有所帮助。我希望看官老爷们评论、转发、点赞 — 图名不图利。咱们共同进步。