TensorFlow_字节宝

[源码解析] TensorFlow 分布式之 MirroredStrategy

MirroredStrategy 策略通常用于在一台机器上用多个GPU进行训练。其主要难点就是：如何更新 Mirrored 变量？如何分发计算？本文我们看看其总体思路和如何更新变量。...

mapreduce 分布式 TensorFlow 编程算法

2022-05-09

[源码解析] TensorFlow 之分布式变量

在 TensorFlow 之中，分布式变量是在多个设备上创建的变量。Mirrored variable 和 SyncOnRead variable 是两个例子。本文就对分布式变量进行分析。我们通过一系列问题来引导分析：...

编程算法分布式 TensorFlow

2022-05-09

[源码解析] TensorFlow 分布式 DistributedStrategy 之基础篇

前文之中我们已经介绍了 Strategy 这个基本概念，tf.distribute.Strategy 是一个可在多个 GPU、多台机器或 TPU 上进行分布式训练的 TensorFlow API。使用此 API，您只需改动较少代码就能基于现有模型和训练代码来实现单...

分布式编程算法 TensorFlow Java api

2022-05-09

[翻译] 使用 TensorFlow 进行分布式训练

https://tensorflow.google.cn/guide/distributed_training（此文的信息是2.3版本之前）。

TensorFlow 分布式编程算法 api keras

2022-05-09

[源码解析] TensorFlow 分布式环境(8) --- 通信机制

当计算图在设备之间划分之后，跨设备的 PartitionGraph 之间可能存在着数据依赖关系，因此 TF 在它们之间插入 Send/Recv 节点，这样就完成数据交互。而在分布式模式之中，Send/Recv 通过 RpcRemoteRendezvous 完成数据交换，所...

TensorFlow JavaScript Node.js 分布式 Ajax

2022-05-09

[源码解析] TensorFlow 分布式环境(7) --- Worker 动态逻辑

前文中，Master 在流程之中先后调用了 gRPC 给远端 worker 发送命令，即，GrpcRemoteWorker 类中的每一个函数都通过调用 IssueRequest() 发起一个异步的 gRPC 调用。GrpcRemoteWorker 一共发了两个请求：RegisterGraphAsync，R...

数据结构 TensorFlow JavaScript Node.js 分布式

2022-05-09