Сложные модели глубокого обучения имеют миллионы параметров (весов), и их обучение с нуля часто требует больших объемов данных и вычислительных ресурсов. Трансферное обучение — это метод, который сокращает многое из этого, беря часть модели, которая уже была обучена для связанной задачи, и повторно используя ее в новой модели.
Например, следующий учебник в этом разделе покажет вам, как создать собственный распознаватель изображений, использующий преимущества модели, которая уже была обучена распознавать тысячи различных типов объектов на изображениях. Вы можете адаптировать существующие знания в предварительно обученной модели для обнаружения собственных классов изображений, используя гораздо меньше обучающих данных, чем требовалось исходной модели.
Это полезно для быстрой разработки новых моделей, а также для настройки моделей в средах с ограниченными ресурсами, таких как браузеры и мобильные устройства.
Чаще всего при переносе обучения мы не корректируем веса исходной модели. Вместо этого мы удаляем последний слой и обучаем новую (часто довольно неглубокую) модель поверх выходных данных усеченной модели. Это метод, который вы увидите продемонстрированным в учебниках в этом разделе:
- Создайте классификатор изображений на основе трансферного обучения
- Создание распознавателя аудио на основе переноса обучения
Дополнительный пример трансферного обучения с использованием TensorFlow.js см. в разделе Использование предварительно обученной модели .