INTRODUCCIÓN

Son diferentes indicadores del grado de distribución de la variable y cuantifican el grado de igualdad en el reparto de los valores de una variable. Los más importantes son:

ÍNDICE DE GINI

Es un índice desarrollado originalmente por Corrado Gini para medir la desigualdad en los ingresos de los habitantes de un país, pero puede utilizarse para medir cualquier forma de distribución desigual. Es un número entre 0 y 1, donde

Índice de Gini 2015
Índice de Gini 2015

Supongamos la siguiente distribución de rentas en un país cualquiera. Las rentas han sido agrupadas en una serie de categorías, cuyos límites serían \(L_{i1}-L_i\), \(x_i\) la marca de cada clase, \(n_i\) su frecuencia absoluta y \(N_i\) su frecuencia absoluta acumulada.

Ejemplo desarrollado del índice de Gini
Ejemplo desarrollado del índice de Gini

Finalmente,

Ejemplo desarrollado del índice de Gini
Ejemplo desarrollado del índice de Gini

EJEMPLO:

Datos de partida

xi <-c(25,75,125,175,225,275,325,375,425,475)                                   # Vector con valores (en este caso, marcas de clase)
ni <-c(23,72,62,48,19,8,14,7,5,2)                                               # Vector con frecuencias
h <-length(ni) 
h
## [1] 10
Ni <-cumsum(ni)
Ni
##  [1]  23  95 157 205 224 232 246 253 258 260
un <-c(xi*ni)
un
##  [1]  575 5400 7750 8400 4275 2200 4550 2625 2125  950
M <-cumsum(un)
M
##  [1]   575  5975 13725 22125 26400 28600 33150 35775 37900 38850
qi <-c(M/sum(un))*100
qi
##  [1]   1.480051  15.379665  35.328185  56.949807  67.953668  73.616474
##  [7]  85.328185  92.084942  97.554698 100.000000
pi <-c(Ni/sum(ni))*100
pi
##  [1]   8.846154  36.538462  60.384615  78.846154  86.153846  89.230769
##  [7]  94.615385  97.307692  99.230769 100.000000

Elaboración de la tabla con todas las variables.

tabla_gini <- cbind(xi,ni,Ni,un,M,pi,qi)
tabla_gini
##        xi ni  Ni   un     M         pi         qi
##  [1,]  25 23  23  575   575   8.846154   1.480051
##  [2,]  75 72  95 5400  5975  36.538462  15.379665
##  [3,] 125 62 157 7750 13725  60.384615  35.328185
##  [4,] 175 48 205 8400 22125  78.846154  56.949807
##  [5,] 225 19 224 4275 26400  86.153846  67.953668
##  [6,] 275  8 232 2200 28600  89.230769  73.616474
##  [7,] 325 14 246 4550 33150  94.615385  85.328185
##  [8,] 375  7 253 2625 35775  97.307692  92.084942
##  [9,] 425  5 258 2125 37900  99.230769  97.554698
## [10,] 475  2 260  950 38850 100.000000 100.000000

Aplicación de la fórmula de Gini:

Gini <- sum(pi-qi)/(sum(pi)-100)
Gini
## [1] 0.1927013

CURVA DE LORENZ

Su autor fue Max O. Lorenz en 1905. Es una representación gráfica utilizada para mostrar la distribución relativa de una variable, por ejemplo los ingresos según hogares o personas. La curva representa:

La curva parte del origen (0,0) y termina en el punto (100,100).

En general la curva se encuentra en una situación intermedia entre estos dos extremos.

En R podemos dibujarlo de manera manual:

plot(pi,qi, 
     type= "l")
lines(pi, qi, 
      col = 2, 
      lwd = 2, 
      type = "p")
legend("topleft", "curva Lorenz", col = 1:2, lty = 1, box.col = 1)

O también podemos dibujarlo a través de la función curva.lorenz del paquete ineq

library(ineq)
curva.lorenz <- Lc(xi,                   # vector con valores
                   ni)                   # vector con frecuencias
plot(curva.lorenz)

📝 ACTIVIDAD DE EVALUACIÓN CONTINUA :

Un aspecto frecuentemente analizado por la Geografía Agraria es el tamaño de las explotaciones agrarias. Hay regiones en las que predominan las grandes explotaciones (“latifundios”) mientras que en otras la propiedad está mucho más repartida (“minifundio”). Importa el fichero explotaciones_agrarias.csv. Crea con él un dataframe, calcula el índice de Gini para cada provincia y compáralos entre sí.

  • Estación 1
h1 <- length(ni1) 
Ni1 <- cumsum(ni1)
un1 <-c(xi*ni1)
M1 <- cumsum(un1)

qi1 <- c(M1/sum(un1))*100
qi1

pi1 <- c(Ni1/sum(ni1))*100
pi1

# Tabla con todas las variables.
tabla_gini1 <- cbind(xi,ni1,Ni1,un1,M1,pi1,qi1)
tabla_gini1

# Aplicación de la fórmula de Gini:

Gini1 <- sum(pi1-qi1)/(sum(pi1)-100)
Gini1
  • Estacion 2
h2 <- length(ni2) 
Ni2 <- cumsum(ni2)
un2 <-c(xi*ni2)
M2 <- cumsum(un2)

qi2 <- c(M2/sum(un2))*100
pi2 <- c(Ni2/sum(ni2))*100

# Tabla con todas las variables.
tabla_gini2 <- cbind(xi,ni2,Ni2,un2,M2,pi2,qi2)
tabla_gini2

# Aplicación de la fórmula de Gini:
Gini2 <- sum(pi2-qi2)/(sum(pi2)-100)
Gini2
  • Estacion 3
h3 <- length(ni3) 
Ni3 <- cumsum(ni3)
un3 <-c(xi*ni3)
M3 <- cumsum(un3)

qi3 <- c(M3/sum(un3))*100
pi3 <- c(Ni3/sum(ni3))*100

# Tabla con todas las variables.
tabla_gini3 <- cbind(xi,ni3,Ni3,un3,M3,pi3,qi3)
tabla_gini3

# Aplicación de la fórmula de Gini:
Gini3 <- sum(pi3-qi3)/(sum(pi3)-100)
Gini3
  • ¿Cuál es la provincia en la que domina la pequeña explotación? ¿y cuál tiene un índice de Gini más alto?
rm(list=ls())