size_字节宝

Transformers 4.37 中文文档（四十六）

MPNet 模型由 Kaitao Song，Xu Tan，Tao Qin，Jianfeng Lu，Tie-Yan Liu 在MPNet: Masked and Permuted Pre-training for Language Understanding中提出。

索引 size 函数模型配置

2024-06-26

Transformers 4.37 中文文档（四十四）

MEGA 模型是由 Xuezhe Ma、Chunting Zhou、Xiang Kong、Junxian He、Liangke Gui、Graham Neubig、Jonathan May 和 Luke Zettlemoyer 在Mega: Moving Average Equipped Gated Attention...

配置索引 size torch 模型

2024-06-26

Transformers 4.37 中文文档（四十三）

MBart 模型是由 Yinhan Liu、Jiatao Gu、Naman Goyal、Xian Li、Sergey Edunov、Marjan Ghazvininejad、Mike Lewis、Luke Zettlemoyer 在多语言去噪预训练神经机器翻译中提出的。

模型配置索引 sequence size

2024-06-26

Transformers 4.37 中文文档（四十二）

M2M100 模型是由 Angela Fan、Shruti Bhosale、Holger Schwenk、Zhiyi Ma、Ahmed El-Kishky、Siddharth Goyal、Mandeep Baines、Onur Celebi、Guillaume Wenzek、Vishrav Chaudhary、Nama...

size 模型配置索引字符串

2024-06-26

Transformers 4.37 中文文档（四十一）

LongT5 模型是由 Mandy Guo、Joshua Ainslie、David Uthus、Santiago Ontanon、Jianmo Ni、Yun-Hsuan Sung 和 Yinfei Yang 在LongT5: Efficient Text-To-Text Transformer for Long Se...

torch 模型配置索引 size

2024-06-26

Transformers 4.37 中文文档（四十）

Hugo Touvron、Thibaut Lavril、Gautier Izacard、Xavier Martinet、Marie-Anne Lachaux、Timothée Lacroix、Baptiste Rozière、Naman Goyal、Eric Hambro、Faisal Azhar、Aurelien R...

配置索引 size 函数模型

2024-06-26

Transformers 4.37 中文文档（三十九）

Jukebox 模型在 Jukebox: A generative model for music 中由 Prafulla Dhariwal, Heewoo Jun, Christine Payne, Jong Wook Kim, Alec Radford, Ilya Sutskever 提出。它引入了一个生成音乐模型......

size 模型配置索引音频

2024-06-26

Transformers 4.37 中文文档（三十七）

OpenAI GPT-2 模型是由 Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei 和 Ilya Sutskever 在 OpenAI 提出的，它是一个因果（单向）变压器，使用语言建模在一个大约 40GB 的文本数据语料库上进行预训练。...

配置索引 config size 模型

2024-06-26

Transformers 4.37 中文文档（三十六）

我们介绍了 GPT-NeoX-20B，这是一个拥有 200 亿参数的自回归语言模型，经过 Pile 训练，其权重将通过宽松许可证免费向公众开放。据我们所知，这是在提交时具有公开可用权重的最大稠密自回归模型。在这项工作中，我们描述了 GPT...

torch 模型配置索引 size

2024-06-26

Transformers 4.37 中文文档（三十四）

FNet 模型由 James Lee-Thorp, Joshua Ainslie, Ilya Eckstein, Santiago Ontanon 在 FNet: Mixing Tokens with Fourier Transforms 中提出。该模型用傅立叶变换替换了 BERT 模型中的自注意力层，仅返回变换的实部......

索引 size 函数模型配置

2024-06-26

5 6 7 8 9

Transformers 4.37 中文文档（四十六）

Transformers 4.37 中文文档（四十四）

Transformers 4.37 中文文档（四十三）

Transformers 4.37 中文文档（四十二）

Transformers 4.37 中文文档（四十一）

Transformers 4.37 中文文档（四十）

Transformers 4.37 中文文档（三十九）

Transformers 4.37 中文文档（三十七）

Transformers 4.37 中文文档（三十六）

Transformers 4.37 中文文档（三十四）

热门文章

热门手册