A menudo, la falta de pensamiento espacial entre los analistas o la carencia de conocimiento acerca del análisis espacial conlleva el que la información de naturaleza espacial sea analizada sin tener en cuenta sus dimensiones espaciales. Al retirar el espacio geográfico del análisis, se pierde una gran cantidad de información o surgen problemas que invalidan los resultados. Por ejemplo, si existe una autocorrelación espacial, entonces la aplicación de la estadística clásica a menudo viola los supuestos esenciales para obtener resultados estadísticamente significativos, y los resultados pueden estar sesgados. Por lo tanto, los datos espaciales son especiales, y para su análisis se deben utilizar nuevos métodos y técnicas que tengan en cuenta las relaciones espaciales y la conceptualización espacial*.

Por datos espaciales hacemos referencia a un tipo de información referenciada geográficamente (“georeferenciada) y que representa fenómenos ubicados en un determinado territorio o espacio. Los datos espaciales no solo poseen los valores o atributos representativos de uno o varios fenómenos de interés (población, la tasa de desempleo, la renta per cápita o la temperatura media mensual), sino también proprorcionan información de naturaleza geográfica (geometría, localización en el espacio -coordenadas y sistema de coordenadas-).

Mientras el análisis estadístico clásico sólo utiliza esos atributos, el análisis espacial combina ambos tipos de información, mediante un conjunto específico de herramientas que veremos más adelante. La inclusión de esa información diferencia los métodos y los estadísticos resultado del análisis espacial respecto a los del análisis de datos clásico (Anselin, 1989).

El formato de los datos espaciales

Los datos espaciales se pueden expresar en varios formatos, siendo los fundamentales el formato vectorial y el formato ráster.

Singularidades de los datos espaciales

Los datos espaciales presentan unas singularidades que, como veremos más adelante, requieren métodos específicos de análisis. Por lo tanto, cabe preguntarse por estas singularidades

  • Cuando existe heterogeneidad espacial, la recopilación de datos y análisis de la información ofrece ciertas dificultades. Por ejemplo, supongamos un estudio sobre la incidencia de determinadas enfermedades, como las cerebrovasculares, en un área urbana donde la población no está distribuida uniformemente (alta heterogeneidad poblacional). Si cartografiamos ese fenómeno, observaremos que ese tipo de enfermedades se concentran en determinados barrios, pero esto no significa que los habitantes de esos barrios puedan tener mayor propensión a sufrir tales dolencias. Simplemente, el agrupamiento de esas dolencias puede deberse al hecho de que más personas viven en estas áreas. En tal caso, hay que tener en cuenta primero la distribución de la población a la hora de plantear posibles vínculos entre ubicación y las tasas de accidente cerebrovascular. Una manera de solventar el problema es transformar los datos originales en ratios (densidad de accidentes cerebrovasculares per cápita) para cada subárea dentro de la ciudad y ajustar la heterogeneidad de la población.

  • Por otro lado, la heterogeneidad espacial no supone la ausencia de autocorrelación espacial. Dentro de un área de estudio, pueden convivir áreas con alta heterogeneidad espacial con autocorrelación espacial negativa, y otras áreas con autocorrelación positiva en un espacio no uniforme. De hecho, la dependencia espacial no se distingue fácilmente de la heterogeneidad espacial. Esto también se conoce en la literatura como el “problema inverso” (Anselin 2010). En la dependencia espacial, la correlación o covarianza entre variables en distintas ubicaciones está determinada por la disposición espacial de los objetos en el espacio geográfico. Sin embargo, aunque la presencia de agrupaciones y de patrones patrones espaciales pueden detectarse a través de diversos procedimientos, como las pruebas de autocorrelación espacial, no podemos determinar si estos conglomerados se deben a un cambio estructural (heterogeneidad) o a un verdadero proceso que crea conglomerados independientemente de la heterogeneidad del espacio.

La calidad de los datos espaciales

Cada vez es mayor la preocupación que existe por la calidad de los datos, ya que las conclusiones de un estudio pueden variar de acuerdo a la disponibilidad o no de una información fiable y rigurosa.

La evaluación de calidad debe tener presente las cuatro componentes que integran la información geográfica. De ahí que son varios los aspectos a considerar en la valoración de la calidad:

Los errores inherentes a la información geográfica.

Debido a la naturaleza de la información geográfica, son muy variados los errores que podemos incorporar a las bases de datos, tanto espaciales como temáticas, con la consiguiente incertidumbre que puedan causar en los resultados obtenidos en un estudio concreto. Hay que partir de la base, de que los errores son consustanciales a los datos ( Gutiérrez Puebla y Gould, 1994). Desde este punto de vista, más que de evitarlos, se trataría de asumirlos e intentar controlarlos, de manera que se limiten sus efectos más perjudiciales.

Las fuentes de error pueden ser muy diversas. El origen de los errores tiene mucho que ver con las principales fases de manejo de la información geográfica en un sistema informático: recogida e introducción de la información, almacenamiento, gestión y análisis y, finalmente, representación. Aronoff (1989) presenta una tipología de errores, en el tratamiento y manejo de la información geográfica, que tienen, precisamente, que ver con este tipo de clasificación: