Python之所以能成为深度学习领域最受宠的编程语言,其中Python三剑客的NumPy、Pandas和Matplotlib功不可没。这3个库分别用于科学计算、数据分析和数据可视化。本系列文章作为深度学习的前传,将开始介绍这3个函数库的核心使用方法,首先介绍一下NumPy。
可能有很多读者会说,NumPy有什么特别的呢?现在用于科学计算的库很多。为什么会提到NumPy呢?因为NumPy 是一个运行速度非常快的科学计算库,这里的关键字不仅是“科学计算”,还有一个“快”。因为NumPy只是用Python作了个外壳,底层逻辑是使用C语言实现的,所以NumPy在运行速度上要远比纯Python代码实现的科学计算库快得多。使用NumPy可以体验到在原生Python代码上从未体验过的运行速度。
那么NumPy到底有什么功能呢?其实NumPy的功能非常多,主要用于数组计算。NumPy可以让你在Python语言中使用向量和数学矩阵。NumPy 是 Python 语言在科学计算领域取得成功的关键之一,如果你想通过 Python语言学习数据科学、人工智能(包括深度学习、语言处理等分支),就必须学习 NumPy。
1. NumPy开发环境搭建
NumPy是第三方程序库,所以在使用NumPy之前必须安装NumPy。如果读者使用的Anaconda Python开发环境,那么NumPy已经集成到Anaconda环境中了,不需要再安装。如果读者使用的是官方的Python开发环境,可以使用如下的命令安装NumPy。
pip install numpy
如果读者要了解NumPy更详细的情况,请访问官方网站,网址如下:
http://www.numpy.org
安装完NumPy后,可以测试一下NumPy是否安装成功。读者可以进入Python的REPL环境,然后使用下面的语句导入numpy模块,如果不出错,就说明NumPy已经安装成功了。
代码语言:javascript复制import numpy
2. 第一个NumPy程序
本节来编写第一个NumPy程序,来体验一下NumPy的强大。在编写程序之前,需要先了解一下这个程序要做什么。
在这个程序中只涉及到numpy模块中的一个arange函数,该函数可以传入一个整数类型的参数n,函数返回值看着像一个列表,其实返回值类型是numpy.ndarray。这是NumPy中特有的数组类型。如果传入arange函数的参数值是n,那么arange函数会返回0到n-1的ndarray类型的数组。而且这个数组还支持很多Python语言的基础运算,如加法( )、减法(-)、次方(**)等。例如,arange(5) ** 2的结果是[ 0 1 4 9 16],可以看到,对一个ndarray类型的数组使用次方运算,实际上是对每一个数组元素进行次方运算。
下面的例子使用arange函数生成了多个ndarray类型的数组,并对数组进行加法和次方运算。
代码语言:javascript复制# 导入numpy模块的arange函数
from numpy import arange
def sum(n):
# 对ndarray类型的数组进行2次方运算
a = arange(n) ** 2
# 对ndarray类型的数组进行4次方运算
b = arange(n) ** 4
# 将两个ndarray类型的数组相加(每个数组元素相加)
c = a b
return c
# 输出0到4的数组,运行结果:[0 1 2 3 4]
print(arange(5))
# 运行结果:[ 0 1 4 9 16]
print(arange(5) ** 2)
# 运行结果:[ 0 1 16 81 256]
print(arange(5) ** 4)
# 运行结果:[ 0 2 20 90 272]
print(sum(5))
程序运行结果如图1所示。
图1 数组运算
3. 创建多维数组
numpy模块的array函数可以生成多维数组。例如,如果要生成一个二维数组,需要向array函数传一个列表类型的参数,每一个列表元素是一维的ndarray类型数组,作为二维数组的行。另外,通过ndarray类的shape属性可以获得数组每一维的元素个数(元组形式),也可以通过shape[n]形式获得每一维的元素个数,其中n是维度,从0开始。
下面的例子使用array函数和arange函数生成了多个二维数组,并输出了这些二维数组以及相关的属性值。
代码语言:javascript复制from numpy import *
# 创建一个一维的数组
a = arange(5)
# 输出一维数组,运行结果:[0 1 2 3 4]
print(a)
# 输出数组每一维度的元素个数,运行结果:(5,)
print(a.shape)
# 输出第一维的元素个数,运行结果:5
print(a.shape[0])
# 创建一个3*3的二维数组
m1 = array([arange(3),arange(3),arange(3)])
print(m1)
# 创建一个2*3的二维数组
m2 = array([arange(3),arange(3)])
print(m2)
# 创建一个3*3的混合类型数组(每个数组元素的类型可能不一样)
m3 = array([["a","b",4],[1,2,3],[5.3,5,3]])
print(m3)
# 输出m2数组每一维度元素的个数,运行结果:(2, 3)
print(m2.shape)
# 运行结果:m2是2维数组
print("{}是{}维数组".format("m2", len(m2.shape)))
# 输出m2的第1维的元素个数,运行结果:2
print(m2.shape[0])
# 输出m2的第2维的元素个数,运行结果:3
print(m2.shape[1])
程序运行结果如图2所示。
图2 创建二维数组