用例子看看,Python 3.12 到底更新了啥?

2023-10-24 18:04:53 浏览数 (1)

这是「进击的Coder」的第 878 篇技术分享

作者:小奶球

链接:https://juejin.cn/post/7244174211957440572

在前不久,python 3.12 正式发布了,那到底更新了哪些内容呢?一起来看看

# 改善报错信息

来自官方标准库的模块现在可以在报NameError时提示问题原因,比如

代码语言:javascript复制
>>> sys.version_info
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'sys' is not defined. Did you forget to import 'sys'?

当实例内报NameError时也会提示问题原因,比如成员方法引用了未定义的变量,而这个变量名又和成员变量名相同时会提示用户是否忘记加self,比如

代码语言:javascript复制
>>> class A:
...    def __init__(self):
...        self.blech = 1
...
...    def foo(self):
...        somethin = blech

>>> A().foo()
Traceback (most recent call last):
  File "<stdin>", line 1
    somethin = blech
               ^^^^^
NameError: name 'blech' is not defined. Did you mean: 'self.blech'?

当导入模块时importfrom写反报SyntaxError时也会提示原因,比如

代码语言:javascript复制
>>> import a.y.z from b.y.z
Traceback (most recent call last):
  File "<stdin>", line 1
    import a.y.z from b.y.z
    ^^^^^^^^^^^^^^^^^^^^^^^
SyntaxError: Did you mean to use 'from ... import ...' instead?

在导入模块错误报ImportError时也会提示应该导入哪个对象,比如

代码语言:javascript复制
python
复制代码>>> from collections import chainmap
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ImportError: cannot import name 'chainmap' from 'collections'. Did you mean: 'ChainMap'?

# 新功能

PEP701 f-string的语义格式化

现在f-string内的表达式可以是任何合法的Python表达式,包括反斜杠、Unicode转义、多行表达式、注释和重复使用的引号种类。

  • 重复使用的引号种类:在Python 3.12版本中,用户可以在表达式里重复使用f-string使用过的引号种类,比如这里重复使用了双引号
代码语言:javascript复制
>>> songs = ['Take me back to Eden', 'Alkaline', 'Ascensionism']
>>> f"This is the playlist: {", ".join(songs)}"
'This is the playlist: Take me back to Eden, Alkaline, Ascensionism'

因为这个改动,现在Python可以内嵌多个f-string了,比如以前只能内嵌4层

代码语言:javascript复制
>>> f"""{f'''{f'{f"{1 1}"}'}'''}"""
'2'

现在则没有这种限制

代码语言:javascript复制
>>> f"{f"{f"{f"{f"{f"{1 1}"}"}"}"}"}"
'2'
  • 多行表达式和注释:以前在f-string中必须把表达式写在一行内,可读性不高。现在没有这种限制,并且可以包含注释。
代码语言:javascript复制
>>> f"This is the playlist: {", ".join([
... Take me back to Eden',  # My, my, those eyes like fire
... 'Alkaline',              # Not acid nor alkaline
... 'Ascensionism'           # Take to the broken skies at last
...])}"
'This is the playlist: Take me back to Eden, Alkaline, Ascensionism'
  • 反斜杠和Unicode字符:以前在f-string中不能使用反斜杠和Unicode转义。这会使得有的Unicode字符无法在f-string中使用,现在没有这种限制了。
代码语言:javascript复制
python
复制代码>>> print(f"This is the playlist: {"n".join(songs)}")
This is the playlist: Take me back to Eden
Alkaline
Ascensionism
>>> print(f"This is the playlist: {"N{BLACK HEART SUIT}".join(songs)}")
This is the playlist: Take me back to Eden♥Alkaline♥Ascensionism

一个有用的副作用就是现在报错的位置更精准了。比如在3.11中解释器不能告诉用户SyntaxError错误产生的位置。

代码语言:javascript复制
>>> my_string = f"{x z y}"   f"{1   1}"
  File "<stdin>", line 1
    (x z y)
     ^^^
SyntaxError: f-string: invalid syntax. Perhaps you forgot a comma?

现在可以获取到报错位置了。

代码语言:javascript复制
>>> my_string = f"{x z y}"   f"{1   1}"
  File "<stdin>", line 1
    my_string = f"{x z y}"   f"{1   1}"
                   ^^^
SyntaxError: invalid syntax. Perhaps you forgot a comma?

PEP709 内联行为

现在解释器会把字典、列表和集合理解成内联行为,而不是只用一次的数据结构,这样做会让程序运行速度提升一倍。但是,迭代器并不会理解成内联行为。

译者:这部分关系到虚拟机帧栈的优化,其API对普通用户并无感知。

PEP 688 Buffer协议可以暴露给用户使用

这个提案介绍了如何让Python用户使用到buffer协议,只需要让类实现__buffer__()方法就可以把它当作Buffer类使用。

与此同时,新的collections.abc.Buffer抽象基类提供了标准的暴露buffer的方式,比如在类型注解里。在新的inspect.BufferFlags枚举可以表示自定义的buffer资源。

# 与类型注解相关的新功能

PEP 692 用`TypedDict`注解**kwargs类型

PEP 484 介绍了如何注解函数签名中**kwargs的类型,但是所有的**kwargs类型都一样。这份提案提供了一种更精确的类型注解方案,比如

代码语言:javascript复制
from typing import TypedDict, Unpack

class Movie(TypedDict):
  name: str
  year: int

def foo(**kwargs: Unpack[Movie]): ...

PEP 698 静态类型注解的override装饰器

typing模块中加入了一个新的装饰器typing.override(),它表明被它修饰的方法需要复写其父类的同名方法(译者注:类似于Java的@Overide)。它可以让类型检查该方法是否正确复写了父类的方法。

代码语言:javascript复制
from typing import override

class Base:
  def get_color(self) -> str:
    return "blue"

class GoodChild(Base):
  @override  # ok: overrides Base.get_color
  def get_color(self) -> str:
    return "yellow"

class BadChild(Base):
  @override  # type checker error: does not override Base.get_color
  def get_colour(self) -> str:
    return "red" 

PEP 695 参数类型语法

在PEP 484 中,Python对泛型类和方法类型注解的支持有点啰嗦且不够精确,并需要一套更直白的类型声明方案。本提案引入了一种新的、简洁的、直白的类型注解方案。

代码语言:javascript复制
def max[T](args: Iterable[T]) -> T:
    ...

class list[T]:
    def __getitem__(self, index: int, /) -> T:
        ...

    def append(self, element: T) -> None:
        ...

此外,本方案还引入了一种新type别名声明方案,并可以通过type创建一个TypeAliasType实例。

代码语言:javascript复制
type Point = tuple[float, float]

类型别名同样可以加入泛型。

代码语言:javascript复制
type Point[T] = tuple[T, T]

新的语法规则允许声明TypeVarTupleParamSpec,就像声明TypeVar一样。

代码语言:javascript复制
type IntFunc[**P] = Callable[P, int]  # ParamSpec
type LabeledTuple[*Ts] = tuple[str, *Ts]  # TypeVarTuple
type HashableSequence[T: Hashable] = Sequence[T]  # TypeVar with bound
type IntOrStrSequence[T: (int, str)] = Sequence[T]  # TypeVar with constraints  

类型别名、范围以及限制类型只有在解释器需要的时候创建,也就是说别名可以在代码其他地方被重写。

参数类型的声明作用于声明的范围,对其外部是不生效的。举个例子,函数参数的类型注解可以作用于其派生类的方法或该类的其他地方。然而,它不能作用于模块范围内的其他地方,即使这个地方位于该类的定义的后面。具体使用方法可以参考Type parameter lists章节。

为了支持这种范围的类型注解,现在虚拟机引入了一种新的范围——注解范围(annotation scope)。在大多数情况下,这个范围等同于函数的范围,但是它会和不同的类的范围发生关联。在Python 3.13中,所有的类型注解都会在这个范围内。

# 其他语言改动(部分)

  • 增加了环境变量PYTHONPERFSUPPORT、命令行参数-X perf以及API sys.activate_stack_trampoline()、sys.deactivate_stack_trampoline()和sys.is_stack_trampoline_active()以支持Linux优化(Python support for the Linux perf profiler)
  • 如果底层字典结构是可哈希的,那么types.MappingProxyType实例现在也是可哈希的
  • 语法分析器现在可以分析空字节
  • 现在GC只会在字节码之间的暂停点运行,而不是分配内存的时候运行。另外,GC还会在调用PyErr_CheckSignals()时运行。这样,在Python的C扩展中解释器可以执行大量的C语言代码而不去执行Python代码,以便减少GC运行的可能性。
  • 你可以在生成的数据中使用海象运算符(:=)来赋值,比如[(b := 1) for a, b.prop in some_iter]
  • slice对象现在是可哈希的,所以可以用作字典的键。
  • sum()方法现在用了新的求和算法,所以现在更精确了。

# 小结

以上是Python 3.12语法层面的改动。可以看出,现在Python委员会的发力点一个是类型注解,另一个是GC的使用效率。他们这么做也很好理解,这两个问题一直是为人诟病的症结。弱类型语言使得Python成为不了大型项目的开发语言,而效率低下的GC也是阻碍Python往前一步的绊脚石。

不管怎么说,Python毫无疑问是当下最热门的语言,具体会往什么方向发展,让我们拭目以待吧。

End

0 人点赞