ChatGPT 的名称是由Chat 与GPT 两个字组合起来的,Chat 是多数人耳熟能详的单字,就是聊天的意思。因为ChatGPT 是个聊天机器人,所以很可以理解为什么名字中有个Chat,
那GPT 呢? 假如你过去不曾接触过AI 的领域,你可能会对GPT 这个词感到陌生。所以你可能会好奇,为什么ChatGPT 要有GPT 这三个字? 而GPT 这三个字是又是什么意思呢? 让我们在这篇介绍。
为什么叫GPT?
GPT 是Generative Pre-trained Transformer 的缩写,意即生成式预训练的Transformer 模型(因为Transformer 为专有名词,这边不翻译成中文)。让我们来逐一了解这三个字代表什么意思。
- 首先是G,英文是Generative,中文的意思是生成式,这代表的是这个AI 模型是用于生成新的资料。AI 有很多不同类型,过去比较常见的是辨识型的AI,例如手机的人脸辨识解锁,就是透过辨识型AI 做到。而生成式AI 是比起辨识更困难的技术,它可以用来生成文字、图片等资料。
- 接着是P,英文是Pre-trained,中文的意思是预训练,意即这个AI 模型是预先被训练的,GPT 的训练最开始是无监督式的(unsupervised),换句话说就是没有人类介入,没有特别数据标注,大量地把网路上的资料喂到模型中。在无监督式训练后,再搭配人类介入的微调(fine-tuning),让模型的输出成为人类偏好的回应。
- 最后是T,是指Transformer,上面提到因为它是一个专有名词,所以没有特别翻译成中文。这个Transformer 是Google 在2017 年提出的一个深度学习模型,这个模型是以注意力(attention) 为机制来产生预测。而GPT 正是基于这个Transformer 模型进一步发展的模型。
在分别了解完Chat 与GPT 后,可以得知ChatGPT 这个聊天机器人,是一种生成式的AI,所以它会生成新的资料;同时因为它是预训练的,所以能够生成出符合人类偏好的内容,让人觉得它像有智慧一样。