Python新建序列,怎么写更快

2024-02-26 21:26:29 浏览数 (1)

大家好,欢迎来到 Crossin的编程教室~

一组1000万个0~100的整数序列,用它来生成一个新的序列,要求如果原本序列中是奇数就不变,如果是偶数就变成原来的一半。

你会怎么写?

来看几份参考答案:

青铜:

代码语言:javascript复制
def for_method(data):
    result = []
    for x in data:
        if x % 2 == 0:
            result.append(x // 2)
        else:
            result.append(x)
    return result

(自测耗时:0.95秒)

新建一个空列表,for循环遍历原列表,依次判断每个元素,如果能被2整除就除以2添加进新列表,否则直接添加进新列表。

白银:

代码语言:javascript复制
def lc_method(data):
    return [x if x % 2 else x // 2 for x in data]

(自测耗时:0.75秒)

通过列表解析式生成新列表,不仅代码更简洁明了,耗时还变少了。

黄金:

代码语言:javascript复制
def numpy_method(data):
    arr = np.array(data)
    return np.where(arr % 2 == 0, arr // 2, arr).tolist()

(自测耗时:0.90秒)

用numpy的where方法生成新的数组。看起来效率好像还不如列表解析式嘛?这是因为大部分时间都花在了列表和ndarray的转换上。如果这组序列本身就用numpy的数组来存储的话:

代码语言:javascript复制
def numpy_array_method(data):
    return np.where(data % 2 == 0, data // 2, data)

(自测耗时:0.32秒)

速度直接碾压列表解析式。

王者:

代码语言:javascript复制
@numba.jit(nopython=True)
def numba_method(data):
    result = np.copy(data)
    for i in range(len(data)):
        if result[i] % 2 == 0:
            result[i] //= 2
    return result

(自测耗时:0.65秒)

还是用for循环,不过给函数加上一个装饰器,表示用Numba JIT编译,这个看起来平平无奇的写法会有什么效果呢?好像也没有比直接用numpy快多少嘛?

别急,让我们加大剂量,把序列长度调整到1亿,优势就体现出来了。(numba:1.21秒 vs numpy:3.04秒)

你还有其他写法吗?

作者:Crossin的编程教室

0 人点赞