模型训练既要让模型知道该做什么,也要让模型知道不该做什么!目前绝大数的语言模型都是通过标注好的数据进行训练,并希望模型输出结果像标注的正例数据一样好,然而却忽略了负例数据的重要性。因为模型训练仍然需要少量的负...
模型训练既要让模型知道该做什么,也要让模型知道不该做什么!目前绝大数的语言模型都是通过标注好的数据进行训练,并希望模型输出结果像标注的正例数据一样好,然而却忽略了负例数据的重要性。因为模型训练仍然需要少量的负...
引言 一些大的产品公司,都有自己的客户支持。当你打电话/对话完成之后,经常会被问及“你有多大可能将我们推荐给你的朋友或家人?”。产品公司做这样做主要是评估自己的服务或者产品是否满足用户需求,进而及时...
像GPT-3这样的大规模生成语言模型非常适合小样本学习。虽然这些模型能够联合表示许多不同的语言,但它们的训练数据以英语为主,这会限制它们的跨语言泛化。本文在涵盖多种语言的语料库上训练多语言生成语言模型,并研究它...
边界信息是各种中文自然语言处理任务的关键,如分词、词性标注和命名实体识别。之前的研究往往使用高质量的外部词典提供显式的边界信息。然而为保证词典的质量,往往需要大量的人力。为此,在本文使用无监督的统计边界信息...