最新 最热

使用bRPC和ONNX Runtime把Bert模型服务化

在上文《实践演练Pytorch Bert模型转ONNX模型及预测》中,我们将Bert的Pytorch模型转换成ONNX模型,并使用onnxruntime-gpu完成了python版的ONNX模型预测。今天我们来把预测搬到C++上,模拟一下模型的部署。...

2022-11-20
1