深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下,每个迭代的速度越快,整个模型的预测性能就越快。我收集了几个PyTorch技巧,以最大化内存使用效率和最小化运行时间。为了更好地利用这些技巧,我们还需...
Polygraphy在我进行模型精度检测和模型推理速度的过程中都有用到,因此在这做一个简单的介绍。
20229月GTC大会,NVIDIA CEO黄仁勋发布了Jetson Orin NANO模组。终于让大家吃了一个定心丸:Jetson NANO产品后继有“芯”了!但是,请注意,本次发布的是模组,不是开发套件,而且按照NVIDIA在后续GTC的讲座里,NVIDIA应该不会出Ori...
论文:https://arxiv.org/abs/1912.04488 代码:https://github.com/WXinlong/SOLO
tf.math.top_k可以帮助我们查找最后一个维度的 k 个最大条目的值和索引.
https://iamarookie.blog.csdn.net/article/details/117651502
原文链接:https://tensorflow.google.cn/api_docs/python/tf/tuple?hl=en 张量分组。tf.tuple( tensors, n
重塑张量,给定tensor,这个操作返回一个张量,它与带有形状shape的tensor具有相同的值。
创建一个所有元素都设为1的张量。给定一个张量(张量),这个操作返回一个与所有元素都设为1的张量类型和形状相同的张量。还可以为返回的张量指定一个新类型(dtype)。...
计算元素跨张量维数的平均值。(弃用参数)有些论点是不赞成的。它们将在未来的版本中被删除。更新说明:不推荐使用keep_dims,而是使用keepdims沿着坐标轴给出的维数减少input_张量。除非keepdims为真,否则对于轴上的每一...