pytorch mseloss_pytorch handbook

2022-10-02 13:22:24 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

均方损失函数:

loss(xi,yi)=(xi−yi)2 loss ( x i , y i ) = ( x i − y i ) 2

text{loss}(mathbf{x}_i, mathbf{y}_i)=(mathbf{x}_i - mathbf{y}_i)^2

这里 loss, x, y 的维度是一样的,可以是向量或者矩阵,i 是下标。

很多的 loss 函数都有 size_average 和 reduce 两个布尔类型的参数。因为一般损失函数都是直接计算 batch 的数据,因此返回的 loss 结果都是维度为 (batch_size, ) 的向量。

(1)如果 reduce = False,那么 size_average 参数失效,直接返回向量形式的 loss
(2)如果 reduce = True,那么 loss 返回的是标量
代码语言:javascript复制
a)如果 size_average = True,返回 loss.mean();
b)如果 size_average = False,返回 loss.sum();

注意:默认情况下, reduce = True,size_average = True

代码语言:javascript复制
import torch
import numpy as np

1、返回向量

代码语言:javascript复制
loss_fn = torch.nn.MSELoss(reduce=False, size_average=False)
代码语言:javascript复制
a=np.array([[1,2],[3,4]])
b=np.array([[2,3],[4,5]])
代码语言:javascript复制
input = torch.autograd.Variable(torch.from_numpy(a))
target = torch.autograd.Variable(torch.from_numpy(b))

这里将Variable类型统一为float()(tensor类型也是调用xxx.float())

代码语言:javascript复制
loss = loss_fn(input.float(), target.float())
代码语言:javascript复制
print(loss)
代码语言:javascript复制
tensor([[ 1.,  1.],
        [ 1.,  1.]])

2、返回平均值

代码语言:javascript复制
a=np.array([[1,2],[3,4]])
b=np.array([[2,3],[4,4]])
代码语言:javascript复制
loss_fn = torch.nn.MSELoss(reduce=True, size_average=True)
代码语言:javascript复制
input = torch.autograd.Variable(torch.from_numpy(a))
target = torch.autograd.Variable(torch.from_numpy(b))
代码语言:javascript复制
loss = loss_fn(input.float(), target.float())
代码语言:javascript复制
 print(loss)
代码语言:javascript复制
tensor(0.7500)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/192029.html原文链接:https://javaforall.cn

0 人点赞