华为诺亚方舟实验室最近的研究表明,古人诚不我欺也。中国古诗词意境深远、格律优美、朗朗上口,是中国文化中璀璨的明珠。但由于形式和内容上的严格要求,普通人很难掌握写诗的技巧。AI古诗词写作近年来成为很多研究者关注的话题,随着深度学习技术的成熟,出现了一些非常优秀的中国古诗词生成系统。2018年,预训练语言模型在NLP领域取得了极大的成果,特别是GPT模型,在语言生成中表现出了优异的性能。我们首次将GPT模型应用于中国古诗词生成,提出了基于GPT模型的中国古诗词生成方法。我们的研究发现,GPT模型在中国古诗词生成上表现极为出色。我们首先利用大规模中文新闻语料训练得到一个中文GPT模型。然后我们对收集得到的大量中国古代诗歌、词、对联按照特定的格式进行整理,再将整理好的数据输入到GPT模型中进行微调(fine-tune),就得到了一个高质量的古诗词生成系统,我们将它命名为【乐府】。乐府系统能够按照格律要求生成非常高质量的古诗、词和对联。通过对训练数据的适当调整,我们还能够生成特定形式的藏头诗。特别令人惊讶的是,我们对GPT模型没有进行任何定制修改,没有人工输入创作古诗所需要的字数、韵律、平仄、对仗等任何知识,没有定义任何这方面的特征,也没有输入任何人工编制的词典,系统完全从语料中学到了作诗能力,掌握了这些复杂的作诗技巧。下面是乐府系统生成的一些诗词样例:
【乐府】对联样例(给出上联对下联):
注:严格来说,对联并不属于诗词。我们这里为简单起见,把对联也当成古诗词的一类。
【乐府】生成的近体诗样例:
【乐府】生成的词样例:
【乐府】生成的藏头诗样例:
关于该方法的更多细节请参考我们的论文:https://arxiv.org/abs/1907.00151。我们提供了该系统的诗歌生成在线演示版本,长按下方二维码可前往测试。