要深入了解大模型底层原理,先要能手撸transformer模型结构,在这之前,pytorch、tensorflow等深度学习框架必须掌握,之前做深度学习时用的tensorflow,做aigc之后接触pytorch多一些,今天写一篇pytorch的入门文章吧,感兴趣的可以...
一开始,稚嫩的我只是想能在实际应用场合中使用一些深度模型(结果没想到后面坑这么大),这就需要涉及到,如何将实验室里基于pytorch的一个开发模型,部署到算力和系统架构都不同的嵌入式设备中。随后我了解到了,部署到嵌入式设...
本文是PyTorch常用代码段合集,涵盖基本配置、张量处理、模型定义与操作、数据处理、模型训练与测试等5个方面,还给出了多个值得注意的Tips,内容非常全面。...
Tensor(张量)是PyTorch中用于表示多维数据的主要数据结构,类似于多维数组,可以存储和操作数字数据。