最近,faster-cpython 项目的文档介绍了关于 Python 3.13 的规划,以及在 3.13 版本中将要实现的一些优化和改进。faster-python 是 Python 的创始人 Guido van Rossum 和他的团队提出的计划 ,目标是在四年内将 CPython 的性能提升五倍。
项目目标
faster-cpython 项目的目标是提高 Python 解释器的性能,使其能够更好地支持大型应用程序和数据科学领域。3.13 的目标是将花在解释器上的时间减少至少 50%。希望通过以下方式实现这一目标:
- 使用分层编译(tiered compilation)技术,根据代码的执行频率和热度,动态地选择不同级别的优化和编译策略。
- 使用静态分析(static analysis)技术,在运行时之前对代码进行预处理和优化,例如消除冗余操作、推断类型信息、重排指令顺序等。
- 改进字节码指令(bytecode instructions)的定义和生成,使其更清晰、更高效、更易于维护和扩展。
- 改进内存管理(memory management)机制,减少内存分配和垃圾回收的开销,提高内存利用率和缓存友好性。
- 改进对象模型(object model)和类型系统(type system),增加对用户自定义类型(user-defined types)和扩展类型(extension types)的支持,提高对象操作的灵活性和效率。
- 改进模块加载(module loading)和导入(importing)机制,减少启动时间和内存占用,提高模块复用性和兼容性。
- 改进异常处理(exception handling)机制,减少异常抛出和捕获的开销,提高异常安全性和可调试性。
- 改进调试工具(debugging tools)和性能分析工具(performance analysis tools),增加对新特性和优化的支持,提高调试和分析的效率和准确性。
项目计划
根据 Python 语言的发展周期,每六个月发布一个新版本,并在每个版本中实现一些优化和改进。我们目前正在开发 3.13 版本,计划在 2023 年 6 月发布。以下是在 3.13 版本中将要实现的一些主要特性:
- 完成分层编译器(tiered compiler)的设计和实现,包括两个级别:第一级是基于 PEP 659 的自适应优化器(adaptive optimizer),第二级是基于 LLVM 的即时编译器(just-in-time compiler)。第一级优化器负责收集代码执行信息,并根据信息进行一些简单的优化,例如内联缓存(inline caching)、指令专门化(instruction specialization)、循环展开(loop unrolling)等。第二级编译器负责将热点代码编译成机器码,并进行一些复杂的优化,例如常量传播(constant propagation)、死码消除(dead code elimination)、寄存器分配(register allocation)等。
- 完成静态分析器(static analyzer)的设计和实现,包括两个部分:第一部分是基于 AST 的语法分析器(syntax analyzer),第二部分是基于 CFG 的语义分析器(semantic analyzer)。语法分析器负责将源代码解析成抽象语法树(abstract syntax tree),并进行一些语法层面的优化,例如常量折叠(constant folding)、表达式简化(expression simplification)、语句重排(statement reordering)等。语义分析器负责将抽象语法树转换成控制流图(control flow graph),并进行一些语义层面的优化,例如类型推断(type inference)、变量寿命分析(variable lifetime analysis)、数据流分析(data flow analysis)等。
- 完成字节码生成器(bytecode generator)的设计和实现,包括两个部分:第一部分是基于 DSL 的指令定义器(instruction definer),第二部分是基于模板的指令生成器(instruction generator)。指令定义器负责使用自定义的 C-like DSL 来定义字节码指令的语义和行为,例如操作数类型、堆栈效果、异常处理、跟踪和检测等。指令生成器负责根据指令定义来生成不同级别编译器所需的代码,例如主解释器(main interpreter)、第二级解释器(tier 2 interpreter)、文档生成器(documentation generator)、元数据生成器(metadata generator)等。
- 完成内存管理器(memory manager)的设计和实现,包括两个部分:第一部分是基于引用计数(reference counting)的内存分配器(memory allocator),第二部分是基于标记 - 清除(mark-sweep)的垃圾回收器(garbage collector)。内存分配器负责为对象分配和释放内存空间,并维护对象的引用计数。垃圾回收器负责检测和回收循环引用(cyclic reference)造成的内存泄漏。我们将对内存管理器进行一些改进,例如使用子代划分(generational partitioning)、增量扫描(incremental scanning)、弱引用处理(weak reference handling)、池化分配(pooled allocation)等。
- 完成对象模型和类型系统的设计和实现,包括两个部分:第一部分是基于 PyObject 的对象表示法(object representation),第二部分是基于 PyTypeObject 的类型表示法(type representation)。对象表示法负责定义对象的内存布局和属性,例如引用计数、类型指针、值域等。类型表示法负责定义类型的元数据和方法,例如名称、大小、哈希函数、比较函数、访问函数等。我们将对对象模型和类型系统进行一些改进,例如使用紧凑布局(compact layout)、动态调度(dynamic dispatch)、多重继承(multiple inheritance)、混合类型。
相关链接、相关信息来源:
- https://github.com/faster-cpython/ideas
- https://github.com/faster-cpython/ideas/blob/main/3.12/interpreter_definition.md
- https://github.com/faster-cpython/