Theano 中文文档 0.9 - 7.2.1 起手式 —— 代数

2022-12-01 16:30:34 浏览数 (1)

7.2.1 起手式 —— 代数

译者:Python 文档协作翻译小组,原文:Baby Steps - Algebra。 本文以 CC BY-NC-SA 4.0 协议发布,转载请保留作者署名和文章出处。

两个标量相加

为了让我们开始使用Theano并获得我们正在使用的感觉,让我们做一个简单的函数:将两个数字加在一起。这里是你怎么做:

代码语言:javascript复制
>>> import numpy
>>> import theano.tensor as T
>>> from theano import function
>>> x = T.dscalar('x')
>>> y = T.dscalar('y')
>>> z = x   y
>>> f = function([x, y], z)

现在我们已经创建了我们的函数,我们可以使用它:

代码语言:javascript复制
>>> f(2, 3)
array(5.0)
>>> numpy.allclose(f(16.3, 12.1), 28.4)
True

让我们分成几个步骤。第一步是定义两个符号(变量),表示要相加的数量。注意,从现在起,我们将使用术语变量来表示“符号”(换句话说,xyz都是变量对象)。函数f的输出是零维度的numpy.ndarray

如果你正在跟着输入解释器,你可能已经注意到执行function指令有一点点延迟。在幕后,f正在被编译成C代码。

步骤1

代码语言:javascript复制
>>> x = T.dscalar('x')
>>> y = T.dscalar('y')

在Theano中,所有的符号必须具有类型。特别地,T.dscalar是我们分配给“0维数组(双精度浮点数(d)的标量)”的类型。它是Theano的Type类型。

dscalar不是类。因此,xy都不是dscalar的实例。它们是TensorVariable的实例。然而,xytype字段赋值为theano的dscalar类型,正如你在下面看到的:

代码语言:javascript复制
>>> type(x)
<class 'theano.tensor.var.TensorVariable'>
>>> x.type
TensorType(float64, scalar)
>>> T.dscalar
TensorType(float64, scalar)
>>> x.type is T.dscalar
True

通过使用字符串参数调用T.dscalar,你将创建一个给定名称的变量,表示一个浮点数标量。如果你不提供参数,符号将不会命名。名称不是必需的,但它们可以帮助调试。

一会儿会更多地说到Theano的内部结构。你也可以通过查看Graph Structures了解更多。

步骤2

第二步是将xy组合到它们的和z中:

代码语言:javascript复制
>>> z = x   y

z是另一个变量,表示xy相加。你可以使用pp函数精确打印与z相关的计算。

代码语言:javascript复制
>>> from theano import pp
>>> print(pp(z))
(x   y)

步骤3

最后一步是创建一个以xy作为输入并将z作为输出的函数:

代码语言:javascript复制
>>> f = function([x, y], z)

function的第一个参数是一个变量列表,它们将作为函数的输入。第二个参数是单个变量一个变量的列表。不管哪一种情况,第二个参数是当我们应用函数时我们想要看到它的输出。f可以像普通的Python函数一样使用。

注意

作为一个捷径,你可以跳过第3步,只需使用变量的eval方法。eval()方法不像function()一样灵活,但它可以完成我们在本教程中介绍的所有内容。它有额外的好处,不需要你导入function()。下面是eval()的工作原理:

代码语言:javascript复制
>>> import numpy
>>> import theano.tensor as T
>>> x = T.dscalar('x')
>>> y = T.dscalar('y')
>>> z = x   y
>>> numpy.allclose(z.eval({x : 16.3, y : 12.1}), 28.4)
True

我们传递给eval()一个字典,将theano的符号变量映射到值来替换它们,然后它返回表达式的数值。

eval()在第一次调用变量时会变慢 - 需要调用function()来编译后台表达式。在同一变量上对eval()的后续调用将很快,因为变量缓存编译的函数。

两个矩阵相加

你可能已经猜到如何做到这一点。实际上,与上一个示例的唯一变化是,你需要使用矩阵类型实例化xy

代码语言:javascript复制
>>> x = T.dmatrix('x')
>>> y = T.dmatrix('y')
>>> z = x   y
>>> f = function([x, y], z)

dmatrix是双精度矩阵的类型。然后我们可以在二维数组上使用我们的新函数:

代码语言:javascript复制
>>> f([[1, 2], [3, 4]], [[10, 20], [30, 40]])
array([[ 11.,  22.],
 [ 33.,  44.]])

变量是NumPy数组。我们也可以直接使用NumPy数组作为输入:

代码语言:javascript复制
>>> import numpy
>>> f(numpy.array([[1, 2], [3, 4]]), numpy.array([[10, 20], [30, 40]]))
array([[ 11.,  22.],
 [ 33.,  44.]])

可以标量与矩阵相加,向量与矩阵相加,标量与向量相加等。这些操作的行为由broadcasting定义。

以下类型可以使用:

  • byte: bscalar, bvector, bmatrix, brow, bcol, btensor3, btensor4, btensor5
  • 16-bit integers: wscalar, wvector, wmatrix, wrow, wcol, wtensor3, wtensor4, wtensor5
  • 32-bit integers: iscalar, ivector, imatrix, irow, icol, itensor3, itensor4, itensor5
  • 64-bit integers: lscalar, lvector, lmatrix, lrow, lcol, ltensor3, ltensor4, ltensor5
  • float: fscalar, fvector, fmatrix, frow, fcol, ftensor3, ftensor4, ftensor5
  • double: dscalar, dvector, dmatrix, drow, dcol, dtensor3, dtensor4, dtensor5
  • complex: cscalar, cvector, cmatrix, crow, ccol, ctensor3, ctensor4, ctensor5

前面的列表并不详尽,并且可以在这里找到与NumPy数组兼容的所有类型的指南:tensor creation。

注意

你作为用户必须选择你的程序将使用32位还是64位整数(i前缀还是l前缀)和浮点数(f前缀还是d前缀)(不是系统架构来选择 )。

练习

代码语言:javascript复制
import theano
a = theano.tensor.vector() # declare variable
out = a   a ** 10               # build symbolic expression
f = theano.function([a], out)   # compile function
print(f([0, 1, 2]))
代码语言:javascript复制
[    0.     2.  1026.]

修改并执行此代码以计算此表达式:a * 2 b * 2 2 * a * b。

答案

0 人点赞