💡 OBJETIVOS:
Familiarizarse con el uso del lenguaje R para realizar la clasificación automática de imágenes satelitales multiespectrales, aplicando técnicas de análisis estadístico y visualización espacial para interpretar y extraer información temática del territorio.
Entender los fundamentos de los procedimientos de clasificación supervisada y no supervisada en R.
Conocer las diferencias, ventajas y limitaciones de los distintos algorítmos de clasificación, evaluando y seleccionando los más apropiados.
Interpretar correctamente (de manera visual y mediante procedimientos estadísticos) los resultados de una clasificación.
Familiarizarse con los procedimientos de validación de clasificaciones de imágenes de satélite.
Analizar los resultados de la clasificación, incluido el etiquetado, la codificación de colores de las clases y el cálculo del área de las clases.
Comprender las diferencias entre los métodos de clasificación basados en píxeles y los basados en objetos.
💡 MATERIALES PARA LA ACTIVIDAD:
Los materiales para el desarrollo de esta actividad son los siguientes.
► Imágenes satélite. Es la misma imagen multibanda utilizada en la actividad previa.
En este módulo, cubriremos técnicas de clasificación de imágenes. La clasificación de imágenes es el proceso de agrupar áreas de una imagen en varias clases o categorías que representan características similares. El proceso produce “mapas temáticos” basados en la imagen o los datos originales. A diferencia de la interpretación de imágenes, que la realiza un humano, la mayoría de estas técnicas de clasificación las realiza un ordenador. La clasificación de imágenes se utiliza en muchos proyectos a escala regional y, a menudo, se realiza para generar conjuntos de datos de cobertura terrestre, y proporciona información adecuada para su uso en planificación y evaluación a nivel de paisaje. La clasificación de imágenes también puede ayudar a rastrear y explicar cambios en el entorno a lo largo del tiempo.
La clasificación de imágenes de satélite se usa para identificar y clasificar los diversos elementos que aparecen en las imágenes a partir de su firma espectral, por lo que se realizan habitualmente sobre imágenes multibanda. Durante el proceso cada píxel de una imagen se asigna a una clase o categoría particular.
La imagen resultante se compone de un mosaico de píxeles, cada uno de los cuales pertenece a una categoría, y puede considerarse un “mapa” temático de la imagen original .
Cuando se habla de clases o categorías, se debe distinguir entre clases de información y clases espectrales.
Las clases de información son aquellas coberturas reales que se trata de identificar en las imágenes, es decir, los diferentes tipos de cultivos, de bosques, unidades geológicas etc..
Las clases espectrales son grupos de píxeles que son similares con respecto a sus valores de brillo en las diferentes bandas espectrales.
El objetivo del proceso de clasificación es hacer coincidir las clases espectrales (imágenes) con las clases de información de interés (realidad). Cabe señalar que rara vez hay una simple coincidencia entre ambos tipos de clases, ya que pueden aparecer clases espectrales únicas que no necesariamente corresponden a categorías reales o de interés para el analista. De la misma manera, una misma clase de información (por ejemplo, un bosque) puede abarcar una serie de subclases con variaciones espectrales únicas, que pueden deberse a variaciones en el porte de los árboles, en la densidad o en la especie, o incluso como resultado de sombras o variaciones en la iluminación de la escena. Es el trabajo del analista decidir sobre la utilidad de las diferentes clases espectrales y su correspondencia con las clases de información útil.
Existen varios enfoques para la clasificación de imágenes y este módulo se centrará en técnicas de clasificación basadas en computadora. Los principales tipos de clasificación de imágenes son:
Clasificación manual
Clasificación basada en píxeles: no supervisada y supervisada.
Segmentación y clasificación basada en objetos o características.
Algunas personas consideran que la clasificación manual es la forma más rudimentaria de clasificación de imágenes. La clasificación manual o visual se refiere a la interpretación y clasificación de imágenes por parte del ojo humano. Antes de las computadoras, ésta era la única manera de realizar la clasificación. En el análisis geoespacial moderno, esto ahora se logra mediante la digitalización “heads-up”, que se cubrió en módulos anteriores. La digitalización manual puede resultar útil y apropiada en muchos escenarios. Tiende a funcionar bien para áreas contiguas pequeñas, pero puede no ser ideal para áreas de estudio grandes y no contiguas. La digitalización también puede llevar mucho tiempo y ser repetitiva, pero cuando se hace bien puede producir resultados confiables y consistentes.
Los métodos de clasificación basados en píxeles utilizan los valores de píxeles de una imagen para asignar cada píxel de la imagen a una clase. Cada píxel se asigna a una clase en función de su característica espectral, esto se conoce como Reconocimiento de patrones espectrales. El objetivo de la clasificación basada en píxeles es asignar todos los píxeles de la imagen a clases o temas particulares (por ejemplo, agua, bosques de coníferas, bosques caducifolios, agricultura). El número y tipo de clases lo decide el analista. Los dos tipos de clasificación basada en píxeles son:
Es el procedimiento más sencillo de aplicación, ya que el agrupamiento de los píxeles en clases espectrales se basa únicamente en la información numérica de los datos. La labor del investigador es sencilla, simplemente elegir qué algorítmo de agrupación debe aplicarse para determinar las agrupaciones o estructuras estadísticas de los datos, y especificar cuántos grupos (“clusters” o conglomerados) se deben buscar en los datos. También es posible especificar parámetros relacionados con la distancia de separación entre los clusters y la variación dentro de cada cluster.
El resultado final de este proceso iterativo puede dar como resultado algunos clusters que el analista querrá combinar posteriormente, o clusters que deberían desglosarse aún más - cada uno de ellos requiere una nueva aplicación del algoritmo de clustering. Así pues, la clasificación no supervisada no carece por completo de intervención humana. Sin embargo, no parte de un conjunto predeterminado de clases como en una clasificación supervisada.
En una clasificación supervisada, el usuario identifica en las imágenes espacios homogéneos representativos (muestras) correspondientes a los distintos tipos de cubierta superficial (clases de información). Estas muestras se denominan áreas de entrenamiento.
La selección de las zonas de entrenamiento adecuadas se basa en la familiaridad del usuario con la zona geográfica y en su conocimiento de los tipos de cobertura de superficie reales presentes en la imagen. De este modo, el usuario «supervisa» el establecimiento del número y de la composición de las clases o categorías.
La información numérica proporcionada por todas las bandas espectrales de los píxeles que componen estas áreas se utiliza para «entrenar» al ordenador a reconocer áreas espectralmente similares. El usuario también decide qué algoritmo aplicará el ordenador para determinar las «firmas» numéricas de cada clase de entrenamiento. Una vez que el ordenador ha determinado las firmas de cada clase, cada píxel de la imagen se compara con estas firmas y se etiqueta como la clase a la que más se «parece».
Por lo tanto, en una clasificación supervisada primero se identifican las clases de información que luego se utilizan para determinar las clases espectrales que las representan.
¿Qué conviene conocer?
Tema | No Supervisada | Supervisada |
---|---|---|
Datos requeridos | Ninguno | Muestras de entrenamiento |
Resultado inicial | Clases sin etiqueta temática | Clases temáticas |
Interpretación | Posterior y visual | Incorporada en el proceso |
Facilidad | Más sencilla, pero menos precisa 1 Más compleja, pero más potente | |
Uso ideal | Exploración, desconocimiento del área | Estudios detallados, monitoreo |
Cabría preguntarse, en consecuencia, qué es más conveniente aprender primero:
Si estás comenzando en teledetección, la clasificación no supervisada es ideal para entender cómo responden espectralmente los objetos.
Si ya tienes una base sólida o acceso a datos de campo, la clasificación supervisada te permitirá hacer análisis más aplicados y útiles para la toma de decisiones.
Los métodos de clasificación basados en píxeles utilizan lo que se conoce como feature space para clasificar los píxeles. El feature space es esencialmente un diagrama de dispersión de los valores espectrales de dos bandas para todos los píxeles de una imagen.
Cuando miramos una imagen de satélite, los píxeles se organizan en una cuadrícula de modo que objetos como lagos, ríos y bosques aparecen de forma similar a como lo harían en una fotografía o en un mapa. También podemos ver datos de imágenes utilizando un sistema de referencia de espacio de características. En un gráfico de espacio de características, los ejes representan el rango de valores posibles para una característica específica. Cuando se utiliza en un algoritmo de clasificación de imágenes, el espacio de características puede tener varias dimensiones, una dimensión para cada banda de la imagen. En otras palabras, si está procesando una imagen de 7 bandas, el algoritmo de clasificación funcionará con un espacio de características de 7 dimensiones. Obviamente, es difícil ver más de tres dimensiones a la vez, por lo que, por razones prácticas, todas las combinaciones posibles de dos bandas se trazan por separado. Por ejemplo, una imagen Landsat con 7 bandas tendría 21 gráficos espaciales de características diferentes (todas las combinaciones posibles de dos bandas). La mayoría de los paquetes de software le permiten utilizar el espacio de funciones para obtener una vista previa de las clases que ha creado y ver cómo se distribuyen.
figura: Feature Space. La figura anterior muestra un gráfico de espacio de características (izquierda) para las bandas NIR y rojas de una imagen Landsat (derecha). Las áreas que se muestran en rojo representan la distribución de los píxeles de agua. Los píxeles que representan el agua generalmente tienen valores de rojo bajos y valores NIR cercanos a cero. Esto tiene sentido ya que sabemos que el agua se refleja mínimamente en NIR y SWIR.
Un píxel es el área espacial más pequeña para la clasificación y la mayoría de los algoritmos de clasificación suponen que un píxel cubre un tipo de cobertura terrestre homogéneo. En realidad, esto no suele ser así. Por ejemplo, Landsat 8 tiene una resolución espacial de 30 m y dentro de esa superficie de 900 m2 podría haber una variedad de características terrestres diferentes. Los números digitales o valores de píxeles de estos píxeles representan el promedio de varias clases espectrales dentro del área que cubre en el suelo. Estos píxeles se conocen como píxeles mixtos. Los píxeles mixtos son comunes en datos con resolución espacial relativamente gruesa y a lo largo de los bordes de las entidades. Cuando un píxel cuya área de fondo está compuesta por dos o más áreas que difieren mucho en términos de brillo espectral, entonces el valor espectral “promedio” que representa el píxel puede no representar con precisión ninguna de las categorías presentes. Esto puede provocar frecuentes clasificaciones erróneas de píxeles mixtos. Estos píxeles son especialmente comunes en áreas urbanas donde puede haber una variedad de elementos (pavimentados, césped, árboles) dentro de áreas pequeñas.
Se han desarrollado varias técnicas en un intento de “separar” la información espectral. Algunas de las técnicas comunes son la clasificación de subpíxeles y la clasificación difusa. La clasificación de subpíxeles intenta identificar las proporciones de los diferentes tipos de cobertura terrestre en un píxel. Por ejemplo, en el píxel Landsat resaltado en la imagen siguiente, una clasificación de subpíxeles podría indicar un 70 % de bosque y un 30 % de terreno desnudo dentro del píxel. La clasificación difusa intenta abordar el problema de los píxeles mixtos utilizando el concepto de que un solo píxel puede pertenecer a más de una categoría o clase. La clasificación difusa permite que los píxeles pertenezcan a más de una clase con un grado de pertenencia a cada clase.
A diferencia de la clasificación por píxeles, que clasifica cada píxel de forma individual, según sus valores espectrales, los procedimientos de clasificación por objetos consideran el contexto espacial.
Estos procedimientos incluye la Segmentación, que es un proceso previo a la clasificación en el enfoque orientado a objetos. Consiste en dividir la imagen en segmentos o regiones homogéneas (agrupaciones de píxeles contiguos que comparten características similares en color, textura, forma, etc.). No asigna una clase temática, solo delimita objetos espaciales dentro de la imagen.
Ejemplo: dividir una imagen en regiones que parecen campos agrícolas, cuerpos de agua, zonas urbanas… pero aún sin clasificar.
Las herramientas típicas son los algoritmos como multiresolución, watershed, quadtree, region growing.
La clasificación por objetos es posterior a la segmentación. A los segmentos obtenidos se les asigna una categoría temática (uso de suelo, cobertura vegetal, etc.) en base a sus atributos:
Estadísticos de las bandas espectrales.
Textura.
Forma.
Relación espacial con otros objetos.
Se puede realizar mediante métodos supervisados o no supervisados, pero a nivel de objeto (segmento), no de píxel, con herramientas como Random Forest, SVM, árboles de decisión, etc., aplicados a objetos.
Resumen:
Concepto | Qué hace | Cuándo ocurre | Ejemplo |
---|---|---|---|
Segmentación | Divide en objetos homogéneos | Antes de la clasificación | Detectar polígonos de bosque |
Clasificación por objetos | Asigna categoría a cada objeto | Después de la segmentación | Clasificar los polígonos como bosque, cultivo, agua |
Clasificación por píxeles | Asigna clase a cada píxel | Directamente sobre la imagen | Cada píxel clasificado como suelo urbano, agua, etc. |