Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

¿Qué es el aprendizaje por transferencia?

Los modelos sofisticados de aprendizaje profundo tienen millones de parámetros (pesos) y su entrenamiento desde cero a menudo requiere grandes cantidades de datos de recursos informáticos. El aprendizaje por transferencia es una técnica que ataja gran parte de esto al tomar una parte de un modelo que ya ha sido entrenado en una tarea relacionada y reutilizarlo en un nuevo modelo.

Por ejemplo, el siguiente tutorial de esta sección le mostrará cómo crear su propio reconocedor de imágenes que aprovecha un modelo que ya fue entrenado para reconocer miles de diferentes tipos de objetos dentro de las imágenes. Puede adaptar el conocimiento existente en el modelo previamente entrenado para detectar sus propias clases de imágenes utilizando muchos menos datos de entrenamiento que los que requería el modelo original.

Esto es útil para desarrollar rápidamente nuevos modelos, así como para personalizar modelos en entornos con recursos limitados, como navegadores y dispositivos móviles.

La mayoría de las veces, al realizar el aprendizaje por transferencia, no ajustamos los pesos del modelo original. En su lugar, eliminamos la capa final y entrenamos un modelo nuevo (a menudo bastante superficial) sobre la salida del modelo truncado. Esta es la técnica que verá demostrada en los tutoriales de esta sección.