【NumPy 数组过滤、NumPy 中的随机数、NumPy ufuncs】

2024-01-30 14:51:10 浏览数 (2)

python之Numpy学习

NumPy 数组过滤

从现有数组中取出一些元素并从中创建新数组称为过滤(filtering)。

在 NumPy 中,我们使用布尔索引列表来过滤数组。

布尔索引列表是与数组中的索引相对应的布尔值列表。

如果索引处的值为 True,则该元素包含在过滤后的数组中;如果索引处的值为 False,则该元素将从过滤后的数组中排除。

实例 用索引 0 和 2、4 上的元素创建一个数组:

代码语言:javascript复制
import numpy as np

arr = np.array([61, 62, 63, 64, 65])

x = [True, False, True, False, True]

newarr = arr[x]

print(newarr)

上例将返回 [61, 63, 65],为什么?

因为新过滤器仅包含过滤器数组有值 True 的值,所以在这种情况下,索引为 0 和 2、4。

创建过滤器数组

在上例中,我们对 True 和 False 值进行了硬编码,但通常的用途是根据条件创建过滤器数组。

实例 创建一个仅返回大于 62 的值的过滤器数组:

代码语言:javascript复制
import numpy as np

arr = np.array([61, 62, 63, 64, 65])

# 创建一个空列表
filter_arr = []

# 遍历 arr 中的每个元素
for element in arr:
  # 如果元素大于 62,则将值设置为 True,否则为 False:
  if element > 62:
    filter_arr.append(True)
  else:
    filter_arr.append(False)

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

实例 创建一个过滤器数组,该数组仅返回原始数组中的偶数元素:

代码语言:javascript复制
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

# 创建一个空列表
filter_arr = []

# 遍历 arr 中的每个元素
for element in arr:
  # 如果元素可以被 2 整除,则将值设置为 True,否则设置为 False
  if element % 2 == 0:
    filter_arr.append(True)
  else:
    filter_arr.append(False)

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

直接从数组创建过滤器

上例是 NumPy 中非常常见的任务,NumPy 提供了解决该问题的好方法。

我们可以在条件中直接替换数组而不是 iterable 变量,它会如我们期望地那样工作。

实例 创建一个仅返回大于 62 的值的过滤器数组:

代码语言:javascript复制
import numpy as np

arr = np.array([61, 62, 63, 64, 65])

filter_arr = arr > 62

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

实例 创建一个过滤器数组,该数组仅返回原始数组中的偶数元素:

代码语言:javascript复制
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

filter_arr = arr % 2 == 0

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

NumPy 中的随机数

什么是随机数?

随机数并不意味着每次都有不同的数字。随机意味着无法在逻辑上预测的事物。

伪随机和真随机

计算机在程序上工作,程序是权威的指令集。因此,这意味着必须有某种算法来生成随机数。

如果存在生成随机数的程序,则可以预测它,因此它就不是真正的随机数。

通过生成算法生成的随机数称为伪随机数。

我们可以生成真正的随机数吗?

是的。为了在我们的计算机上生成一个真正的随机数,我们需要从某个外部来源获取随机数据。外部来源通常是我们的击键、鼠标移动、网络数据等。

我们不需要真正的随机数,除非它与安全性(例如加密密钥)有关或应用的基础是随机性(例如数字轮盘赌轮)。

在本教程中,我们将使用伪随机数。

生成随机数

NumPy 提供了 random 模块来处理随机数。

实例 生成一个 0 到 100 之间的随机整数:

代码语言:javascript复制
from numpy import random

x = random.randint(100)

print(x)

生成随机浮点

random 模块的 rand() 方法返回 0 到 1 之间的随机浮点数。

实例 生成一个 0 到 100 之间的随机浮点数:

代码语言:javascript复制
from numpy import random

x = random.rand()

print(x)

生成随机数组

在 NumPy 中,我们可以使用上例中的两种方法来创建随机数组。

整数 randint() 方法接受 size 参数,您可以在其中指定数组的形状。

实例 生成一个 1-D 数组,其中包含 5 个从 0 到 100 之间的随机整数:

代码语言:javascript复制
from numpy import random

x=random.randint(100, size=(5))

print(x)

实例 生成有 3 行的 2-D 数组,每行包含 5 个从 0 到 100 之间的随机整数:

代码语言:javascript复制
from numpy import random

x = random.randint(100, size=(3, 5))

print(x)

浮点数

rand() 方法还允许您指定数组的形状。

实例 生成包含 5 个随机浮点数的 1-D 数组:

代码语言:javascript复制
from numpy import random

x = random.rand(5)

print(x)

实例 生成有 3 行的 2-D 数组,每行包含 5 个随机数:

代码语言:javascript复制
from numpy import random

x = random.rand(3, 5)

print(x)

从数组生成随机数

choice() 方法使您可以基于值数组生成随机值。

choice() 方法将数组作为参数,并随机返回其中一个值。

实例 返回数组中的值之一:

代码语言:javascript复制
from numpy import random

x = random.choice([3, 5, 7, 9])

print(x)

choice() 方法还允许您返回一个值数组。

请添加一个 size 参数以指定数组的形状。

实例 生成由数组参数(3、5、7 和 9)中的值组成的二维数组:

代码语言:javascript复制
from numpy import random

x = random.choice([3, 5, 7, 9], size=(3, 5))

print(x)

NumPy ufuncs

什么是 ufuncs?

ufuncs 指的是“通用函数”(Universal Functions),它们是对 ndarray 对象进行操作的 NumPy 函数。

为什么要使用 ufuncs?

ufunc 用于在 NumPy 中实现矢量化,这比迭代元素要快得多。

它们还提供广播和其他方法,例如减少、累加等,它们对计算非常有帮助。

ufuncs 还接受其他参数,比如:

where 布尔值数组或条件,用于定义应在何处进行操作。

dtype 定义元素的返回类型。

out 返回值应被复制到的输出数组。

什么是向量化?

将迭代语句转换为基于向量的操作称为向量化。

由于现代 CPU 已针对此类操作进行了优化,因此速度更快。

对两个列表的元素进行相加: list 1: [1, 2, 3, 4]

list 2: [4, 5, 6, 7]

一种方法是遍历两个列表,然后对每个元素求和。

实例 如果没有 ufunc,我们可以使用 Python 的内置 zip() 方法:

代码语言:javascript复制
x = [1, 2, 3, 4]
y = [4, 5, 6, 7]
z = []

for i, j in zip(x, y):
  z.append(i   j)
print(z)

对此,NumPy 有一个 ufunc,名为 add(x, y),它会输出相同的结果。

实例 通过 ufunc,我们可以使用 add() 函数:

代码语言:javascript复制
import numpy as np

x = [1, 2, 3, 4]
y = [4, 5, 6, 7]
z = np.add(x, y)

print(z)

总结

我们的numpy学习结束。

0 人点赞