“Una imagen vale más que mil palabras” es una expresión común que afirma que cualquier tipo de representación visual puede transmitir información de manera más efectiva que una descripción verbal o un texto. De hecho, esta afirmación se sustenta en razones biológicas: la vista es uno de los sentidos más desarrollados de la especie humana, y la transmisión de información al cerebro humano es más sencilla cuando media una imagen, pues la comprensión de un texto requiere una mayor capacidad intelectual. Usualmente, cuando se abre un documento, la primera mirada se focaliza en los gráficos.
Esta razón explica la utilidad de los gráficos en cualquier estudio estadístico. Son otra manera de presentar los datos y ayudan a detectar relaciones, estructuras, patrones y tendencias. La elaboración de gráficos es, por tanto, muy importante en el proceso de comunicación de la información analizada.
Pero realizar un buen gráfico no es tan sencillo, pues requiere:
Captar la atención del lector;
Presentar la información de forma sencilla, clara y precisa;
No inducir a error;
Facilitar la comparación de datos y destacar tanto coincidencias como diferencias;
Ilustrar el mensaje, tema o trama del texto al que acompaña.
Comenzaremos la actividad estableciendo la carpeta de trabajo, sino se ha realizado previamente.
A continuación, se cargará el dataframe alumnos_UC.RData.
Este dataframe cuenta con las siguientes variables.
str(alumnos_uc)
## 'data.frame': 100 obs. of 9 variables:
## $ peso : num 88.1 81.2 89.1 64.3 87.3 ...
## $ edad : int 18 22 19 19 23 20 20 25 25 21 ...
## $ procedencia : Factor w/ 6 levels "Bahía","Besaya",..: 3 2 1 2 5 3 5 5 1 1 ...
## $ genero : chr "Femenino" "Masculino" "Masculino" "Femenino" ...
## $ rama_conocimiento : int 4 1 3 3 1 5 4 3 1 1 ...
## $ rama_conocimiento_let: Factor w/ 5 levels "Arte y Humanidades",..: 4 1 3 3 1 5 4 3 1 1 ...
## $ uso_movil : int 1 3 1 3 3 3 2 2 2 3 ...
## $ uso_movil_let : Ord.factor w/ 3 levels "Escaso"<"Moderado"<..: 1 3 1 3 3 3 2 2 2 3 ...
## $ grupo_sanguineo : Factor w/ 8 levels "A-","A+","AB-",..: 2 8 8 1 2 1 2 8 8 8 ...
También se cargará el dataframe zonas_verdes.RData.
Este dataframe cuenta con las siguientes variables.
str(zonas_verdes)
## 'data.frame': 100 obs. of 6 variables:
## $ ID : int 1 2 3 4 5 6 7 8 9 10 ...
## $ barrio : chr "Salamanca" "Tetuán" "Retiro" "Salamanca" ...
## $ parques : int 5 9 10 9 8 7 6 7 3 5 ...
## $ superficie : num 7.52 6.14 10.65 5.24 7.66 ...
## $ obras : int 0 0 0 NA 1 0 NA 0 0 1 ...
## $ fecha_inauguracion: Date, format: "1960-09-09" "1949-04-24" ...
En ambos dataframes hay variables cualitativas nominales, variables cualitativas ordinales, variables cuantitativas discretas y variables cuantitativas continuas. En función del tipo de variables, los tipos fundamentales de gráficos son:
El gráfico de tallos y hojas.
El gráfico de barras.
El gráfico circular o de sectores.
El histograma.
El polígono de frecuencias.
El gráfico de caja y bigotes (“box-plot”).
Algunos consejos para presentar datos en gráficos:
Elige el gráfico más adecuado para tus datos. No es lo mismo comparar datos que mostrar tendencias temporales o relacionar variables. Hay que seleccionar el gráfico más adecuado en función de los datos disponibles y el mensaje que quieras transmitir. Si hay dudas, es recomendable comparar varios.
Evita utilizar el diagrama de sectores circulares para una variable con muchas categorías (más de 6 ó 7). Puede parecer muy atractivo, pero dificultan la lectura.
Cuanto más simple, mejor. Se debe mostrar la información imprescindible para trasmitir. No es conveniente utilizar muchos colores o tramas diferentes para atraer la atención del espectador; normalmente se consigue lo contrario. Este es el caso también de los efectos 3D: tienden a distorsionar la percepción de los datos y llevar a conclusiones erróneas.
Céntrate en lo importante. Antes de empezar a preparar el gráfico, hay que pensar en cuál es el mensaje que quieres comunicar: la inclusión de muchas ideas oculta el mensaje central. Si no
Piensa en los daltónicos cuando elijas los colores de tus gráficos.