💡 Datos para la actividad:
Datos: para la realización de esta actividad se utilizará el fichero
creado en el tema anterior, que en el caso del ejemplo realizado en
clase, tiene por nombre at_df
. Los ficheros en formato
*.csv utilizados en la unidad pueden descargarse aquí.
Además, se hará uso del dataframe zonas_verdes.
Una vez organizada la información a través de tablas, el siguiente paso es calcular cierto número de valores característicos que resumen nuestros datos y ayudan a su descripción, ya que también anlizan su distribución en conjunto. Estos valores característicos se calculan a partir de la aplicación de una fórmula matemática.
Estos valores suelen denominarse indistintamente parámetros o estadísticos, pero en realidad no son equivalentes:
Los parámetros se calculan sobre toda la población.
Los estadísticos se calculan sobre una muestra.
Si un estadístico se usa para aproximar un parámetro también se le suele llamar estimador.
Dado que normalmente no es posible trabajar con toda la población, la expresión habitual asume que trabajamos con estadísticos. Existen diferentes tipos:
De centralidad (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_centralidad.html).
De dispersión (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_dispersion.html).
De forma (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_forma.html).
De posición (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_posicion.html).
De concentración (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_concentracion.html).
Además, se mostrará cómo calcular algunos de estos estadísticos sobre datos agrupados (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_datos_agrupados.html) y sobre subconjuntos de datos (https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/G2040_05_estadisticos_subconjuntos_datos.html)