💡 OBJETIVOS:

💡 MATERIALES PARA LA ACTIVIDAD:

Los materiales para el desarrollo de esta actividad son los siguientes.

Imágenes satélite. Este fichero comprende:

script_laboratorio_7_supervisada

INTRODUCCIÓN

La clasificación supervisada es una técnica en la que el analista guía el proceso de clasificación de píxeles, especificando las firmas espectrales que deben asociarse a cada clase o categoría. Para ello, se seleccionan muestras representativas de cada tipo de cobertura terrestre, conocidas como sitios de entrenamiento.

El algoritmo utiliza las firmas espectrales derivadas de estas áreas para clasificar la imagen completa. Aunque este método suele ser más preciso que la clasificación no supervisada, su eficacia depende en gran medida de la calidad de los sitios de entrenamiento, de la capacidad del analista y de la diferenciación espectral entre las clases.

Por este motivo, la clasificación supervisada requiere mayor inversión de tiempo y recursos, ya que exige una cuidadosa obtención y validación de los datos de entrenamiento. Si estos datos son deficientes o poco representativos, los resultados también lo serán.

Sitios de entrenamiento

En la clasificación supervisada, gran parte del esfuerzo se concentra antes de ejecutar el proceso de clasificación. El éxito del método depende fundamentalmente de una adecuada selección de los sitios de entrenamiento.

Estos sitios son áreas homogéneas que representan un tipo específico de cobertura terrestre. A partir de los píxeles que contienen, se obtiene la firma espectral característica de cada clase. Esta información se resume mediante variables estadísticas, como la media y la varianza, que permiten diferenciar unas clases de otras.

La selección de estos sitios debe basarse, preferiblemente, en datos de campo o en imágenes de referencia de alta resolución. Además, es fundamental cubrir toda la variabilidad interna de cada clase para mejorar la precisión de la clasificación final. Por ello, se recomienda seleccionar múltiples muestras por clase, aunque esta tarea puede resultar tediosa en ocasiones.

Es importante también evitar la superposición entre clases. Cuando dos o más clases presentan respuestas espectrales similares (por ejemplo, pastizales anuales frente a pastizales perennes), aumenta la probabilidad de error en la clasificación.

Funcionamiento del proceso

Una vez definidos los sitios de entrenamiento, el algoritmo analiza sus patrones de respuesta espectral y los utiliza como referencia para clasificar el resto de los píxeles de la imagen. Los píxeles con características espectrales similares se asignan a la misma clase.

El uso de múltiples sitios de entrenamiento por clase se justifica por la variabilidad espectral existente dentro de una misma cobertura.

El resultado final es una imagen temática, en la que cada píxel queda etiquetado según la clase a la que pertenece.

Métodos de clasificación

La clasificación supervisada puede realizarse mediante diferentes enfoques:

Métodos tradicionales

  • Máxima verosimilitud (Maximum Likelihood): asume una distribución normal de los datos y asigna cada píxel a la clase con mayor probabilidad.

  • Distancia mínima a la media (Minimum Distance to Mean): clasifica los píxeles según su distancia euclidiana al valor medio de cada clase.

  • Distancia de Mahalanobis: considera la varianza y covarianza de las clases, siendo más sensible a la distribución de los datos.

  • Mapeador de ángulos espectrales (SAM): mide la similitud entre espectros calculando el ángulo entre vectores en un espacio multidimensional.

Métodos de aprendizaje automático

El aprendizaje automático es una rama de la inteligencia artificial centrada en el desarrollo de algoritmos capaces de aprender a partir de datos. Su objetivo es extraer información automáticamente mediante métodos estadísticos y computacionales, lo que lo vincula estrechamente con la minería de datos y la estadística.

En la actualidad, existe un uso creciente de algoritmos de aprendizaje automático, que se entrenan con los datos de los sitios de entrenamiento y posteriormente se validan con conjuntos de datos independientes. A diferencia de los métodos tradicionales, estos algoritmos no requieren un modelo predefinido, sino que construyen sus propias reglas a partir de los datos de entrada. Además, pueden actualizarse conforme se incorporan nuevos datos, mejorando progresivamente su rendimiento. Estos métodos permiten modelar relaciones complejas sin necesidad de definir ecuaciones explícitas, ya que aprenden directamente a partir de los datos.

Entre los más utilizados se encuentran:

  • Árboles de decisión

  • Random Forest

  • Máquinas de vectores de soporte (SVM)

  • Regresión logística (binaria y múltiple) etc…

Casos ideales de uso

Debido a su versatilidad, el aprendizaje automático se aplica en numerosos campos, como los negocios, la medicina, la ingeniería, las telecomunicaciones o la seguridad informática. En el ámbito de la teledetección, su aplicación en la clasificación supervisada resulta especialmente relevante. La clasificación supervisada es especialmente adecuada en:

  • Estudios que requieren alta precisión.

  • Monitoreo ambiental y análisis de cambios en el uso del suelo.

  • Planificación territorial.

  • Situaciones en las que se dispone de datos de campo o información de referencia fiable.

Ventajas y desventajas

Ventajas

  • Permite definir las clases temáticas desde el inicio (agua, bosque, urbano, etc.).

  • Ofrece mayor precisión y control cuando las muestras están bien seleccionadas.

Limitaciones

  • Requiere un conjunto de entrenamiento representativo y de alta calidad.

  • Puede presentar problemas de sobreajuste (overfitting).

  • Disminuye su precisión cuando las clases están mal definidas o son espectralmente similares.

En este capítulo se mostrarán algunas técnicas de clasificación supervisada. Por lo tanto, partimos de un conocimiento previo sobre el tipo de usos del suelo, obtenido a través de trabajos de campo, de bases de datos de referencia (por ejemplo, Corine Land Cover) o a través de la interpretación de imágenes de alta resolución (como las disponibles en los mapas de Google). En todos los casos, el procedimiento de clasificación requiere los siguientes pasos:

  1. Generación y preparación de los sitios de entrenamiento.

  2. Extracción de los valores de radiancia correspondientes a los píxeles selecionados en los sitios de entrenamiento.

  3. Entrenamiento del modelo usando el fichero de entrenamiento.

  4. Clasificación de la imágenes a partir del modelo entrenado.

  5. Evaluación de la clasificación.

  6. Interpretación de la clasificación.

El procedimiento seguido en este apartado mostrará esta secuencia lógica

► La creación y elaboración de las muestras de entrenamiento

► La aplicación del modelo. Existen varios algoritmos de clasificación supervisada, y como su elección puede influir en los resultados se exploran tres algoritmos:

Actividades de evaluacion continua.