如何利用ChatGPT做机器翻译?

2023-08-09 14:57:47 浏览数 (3)

随着全球化进程的加速和国际交流的不断增加,人们对于跨语言沟通的需求也在不断增加。如果机器能够快速准确地将一种语言翻译成另一种语言,则将大大提高沟通效率,促进文化交流,推动经济发展,有助于加强不同国家和地区之间的友好往来。

因此,自人工智能技术问世以来,机器翻译就成了重要的研究方向之一。机器翻译被认为是全球有待攻克的九大难题之一(排第1名),其重要性甚至超过了星际旅行。

使用ChatGPT实现机器翻译非常简单,只需给它明确的指令作为提示就可以了。

在一篇名为“Is ChatGPT A Good Translator? A Preliminary Study”的论文中,作者通过如下3个简单的提示指令让ChatGPT完成了翻译任务。

提示指令1 Translate these sentences from [SRC] to [TGT]:

提示指令2 Answer with no quotes. What do these sentences mean in [TGT]?

提示指令3 Please provide the [TGT] translation for these sentences:

这里的[SRC]和[TGT]分别指翻译的源语言和目标语言。如果想让ChatGPT进行英文到中文的翻译,那么可以将提示指令1修改为如下形式。

Translate these sentences from English to Chinese:

再加上需要翻译的内容,ChatGPT就能够帮助我们完成机器翻译的任务。

输入:Translate these sentences from English to Chinese: Across the Great Wall, we can reach every corner in the world.

ChatGPT:这句话的英文原文是“Across the Great Wall, we can reach every corner in the world!”,它的中文翻译是:穿越长城,我们能到达世界的每一个角落。

这里的提示指令也可以用中文,基本不会影响翻译结果,示例如下。

输入:将句子从英语翻译成汉语:Across the Great Wall, we can reach every corner in the world.

ChatGPT:Across the Great Wall, we can reach every corner in the world.可以翻译为:穿越长城,我们可以到达世界的每一个角落。

这里有个有趣的背景小故事:例子中的这句英文“Across the Great Wall, we can reach every corner in the world.”,是1987年9月20日中国第一次涉足全球网络空间时,发送给卡 尔斯鲁厄理工学院的第一封电子邮件的内容。笔者也使用这句话作为本章的第一个示例。

对于简单的机器翻译任务而言,这样的提示指令就足够了。“Is ChatGPT A Good Translator? A Preliminary Study”这篇论文中提到,在标准的通用测试集上,ChatGPT 的翻译水平基本上与谷歌翻译、DeepL 翻译、腾讯翻译等专业的机器翻译模型在同一个水平线上。但是,作为一个翻译软件,ChatGPT略微有点儿啰唆。我们可能并不需要它在输出中把原句重复一遍,只需要翻译的内容。因此,可以应用前面提到的问题重述技巧,加入对任务的更多约束指令。

输入:将句子从英语翻译成汉语:Across the Great Wall, we can reach every corner in the world. 只输出翻译结果,不要复述原文。

ChatGPT:穿过长城,我们可以到达世界上的每一个角落。

在上面这个例子中,笔者让 ChatGPT“只输出翻译结果,不要复述原文”。ChatGPT 很好地理解了这个提示指令,并遵照指令完成了这个翻译任务。

对于更困难的翻译任务(如专业领域的长文本机器翻译),需要使用更高级的提示技巧,例如角色扮演。

输入:假设你是英文翻译人员。我将提供一些中文文本,你需要使用优美且高级的英语词汇和句法将其翻译成英文。这些内容来自计算机科学领域的学术论文,因此请考虑领域背景知识,并确保专业术语的准确性和一致性。考虑到中文和英文表达的语法习惯有所不同,你可以从以英语为母语的人的角度进行适当调整,但请确保主要内容不变。请在回复时仅提供翻译后 的文本,不要引用原文或提供任何解释。以下是我需要翻译的内容:统计机器翻译把翻译问题等同于求解概率问题,即给定源语言s,求目标语言t的条件概率。选取好翻译模型后,从双语平行语料中学习到这些模 型的参数。当输入源语言时,通过学习到的模型大化上述条件概率来获得优翻译结果。

ChatGPT:Statistical machine translation treats translation as a probability problem, which is to find the conditional probability of the target language t given the source language s. After selecting a suitable translation model, the parameters of these models are learned from bilingual parallel corpora. When the source language is input, the optimal translation result is obtained by maximizing the above conditional probability using the learned model.

同样的一句话,笔者也使用谷歌翻译把它翻译成英文,然后对比两个翻译的结果,如图 1所示。

图1

高亮的部分显示出两个翻译版本之间的区别。很明显,ChatGPT的翻译使用的词汇更高级,表达更流畅。然而,对于那些需要依赖机器翻译的普通用户来说,很难自行判断翻译质量的高低。这时,也可以寻求ChatGPT的帮助。例如,可以利用如下提示指令。

对于这段中文文本:

<中文文本>

有如下两个对应的英文翻译:

<英文翻译 1>

<英文翻译 2>

请问这两段翻译哪一段更好,为什么?

ChatGPT给出如下回答。

ChatGPT:这两段翻译都表达了原文的主要意思,但是第一段翻译更好一些。原因如下:

1. 第一段翻译中使用了更准确、更专业的术语,比如“treats translation as a probability problem”“conditional probability”等,更能反映原文的学术性质。2. 第一段翻译的句式和结构更为简洁明了,表达更为清晰,易于读者理解。3. 第一段翻译使用了被动语态,突出了“翻译问题”和“学习到的模型” 的重要性,更符合学术论文的写作风格。综上所述,第一段翻译更好一些。

通过上述回答可以看到,ChatGPT的翻译不但更好,符合“使用高级词汇”等提示指令,而且有理有据。

在机器翻译中,确保术语的翻译准确性和一致性一直是一个大难题,特别是对于长篇文本。即使是GPT-4,一次能够翻译的文本长度也只有大约一万字,因此在翻译长篇著作时,术语一致性的问题可能会出现。使用一个预先确定的术语表是解决术语一致性问题简单可行的方案。翻译时参考这个术语表可以确保术语翻译的一致性和准确性。在现有的一些机器翻译系统中,支持术语表通常被作为高级功能提供给付费用户。如今,我们可以通过提示控制 ChatGPT用术语进行翻译,示例如下。

将这些句子从中文翻译成英文:<中文文本>

请注意确保如下术语翻译的准确性:

<中文术语 1 – Corresponding English terms >

<中文术语 2 – Corresponding English terms >

……

通过这样的提示,ChatGPT大概率能够按照提供的术语词表进行这些领域术语的翻译。读者可能还是会担心,万一它翻译错了什么办,于是还可以加入如下提示,让ChatGPT在翻译完之后重新提取术语词表,便于人工对照,确保按照要求对术语进行了翻译。

将这些句子从中文翻译成英文:<中文文本>

请注意确保如下术语翻译的准确性:

<中文术语 1 – Corresponding English terms >

<中文术语 2 – Corresponding English terms >

……

请在回复时不仅提供翻译后的文本,还要重新依据翻译文本和原文本提取 术语词表,以便对照检查。

加上了这些提示指令后,ChatGPT的输出如下。除了提供翻译结果,还提供了术语词表以供检查。

ChatGPT:Statistical machine translation treats translation as a probability problem, which is to find the conditional probability of the target language t given the source language s. After selecting a suitable translation model, the parameters of these models are learned from bilingual parallel corpora. When the source language is input, the optimal translation result is obtained by maximizing the above conditional probability using the learned model.

术语词表:—

统计机器翻译:Statistical machine translation —

翻译问题:translation problem —

求解概率问题:solving the probability problem —

源语言:source language —

目标语言:target language —

条件概率:conditional probability —

翻译模型:translation model —

双语平行语料:bilingual parallel corpora —

模型参数:model parameters —

优翻译结果:optimal translation result

作为一款基于人工智能技术的大型语言模型,经过合适的提示工程,ChatGPT可以自动生成符合语法规则、表达清晰准确的高质量翻译。在翻译过程中,ChatGPT会考虑上下文、语法结构、领域专业术语等多种因素,尽可能准确地传达原文的意思。ChatGPT还可以根据用户的指令灵活调整语言风格和用词,以满足不同用户的需求。简而言之,ChatGPT比其他专业的机器翻译系统更好、更强大。

本文节选自《与AI对话:ChatGPT提示工程揭秘》一书,更多相关提示技巧可以查阅本书。

0 人点赞