我们已经组装了完整的 Transformer 模型,现在我们准备好训练它进行神经机器翻译。为此,我们将使用一个训练数据集,其中包含简短的英语和德语句子对。我们还将重新审视掩蔽在训练过程中计算准确性和损失指标中的作用。
在本教程中,您将了解如何训练 Transformer 模型进行神[……]
我们已经组装了完整的 Transformer 模型,现在我们准备好训练它进行神经机器翻译。为此,我们将使用一个训练数据集,其中包含简短的英语和德语句子对。我们还将重新审视掩蔽在训练过程中计算准确性和损失指标中的作用。
在本教程中,您将了解如何训练 Transformer 模型进行神[……]