复杂的深度学习模型有数百万个参数(权重),从头训练这些模型通常需要大量数据和计算资源。迁移学习会在新模型中重复使用已在相关任务上训练过的模型的一部分,可以显著降低这些需求。
例如,本部分中的下一个教程将向您展示如何自行构建图像识别器来利用一个已训练的模型识别图像中的 1000 种不同类型的物体。您可以利用预训练模型中的已有知识来检测您自己的图像类,训练数据会比原始模型所需的数据少得多。
在快速开发新模型,以及在浏览器和移动设备等资源受限环境中自定义模型时,这样做非常有用。
进行迁移学习时,我们通常不调整原始模型的权重,而是移除最后一层,并基于截断模型的输出训练一个新的(通常相当浅的)模型。这就是您将在本部分的教程中看到的技术。