Son diferentes indicadores del grado de distribución de la variable y cuantifican el grado de igualdad en el reparto de los valores de una variable. Los más importantes son:
Índice de Gini
Curva de Lorenz
Es un índice desarrollado originalmente por Corrado Gini para medir la desigualdad en los ingresos de los habitantes de un país, pero puede utilizarse para medir cualquier forma de distribución desigual. Es un número entre 0 y 1, donde
El valor 0 se corresponde con la perfecta igualdad (todos tienen los mismos ingresos).
El valor 1 se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno).
Supongamos la siguiente distribución de rentas en un país cualquiera. Las rentas han sido agrupadas en una serie de categorías, cuyos límites serían \(L_{i1}-L_i\), \(x_i\) la marca de cada clase, \(n_i\) su frecuencia absoluta y \(N_i\) su frecuencia absoluta acumulada.
Finalmente,
✅ EJEMPLO:
Datos de partida
xi <-c(25,75,125,175,225,275,325,375,425,475) # Vector con valores (en este caso, marcas de clase)
ni <-c(23,72,62,48,19,8,14,7,5,2) # Vector con frecuencias
h <-length(ni)
h
## [1] 10
Ni <-cumsum(ni)
Ni
## [1] 23 95 157 205 224 232 246 253 258 260
un <-c(xi*ni)
un
## [1] 575 5400 7750 8400 4275 2200 4550 2625 2125 950
M <-cumsum(un)
M
## [1] 575 5975 13725 22125 26400 28600 33150 35775 37900 38850
qi <-c(M/sum(un))*100
qi
## [1] 1.480051 15.379665 35.328185 56.949807 67.953668 73.616474
## [7] 85.328185 92.084942 97.554698 100.000000
pi <-c(Ni/sum(ni))*100
pi
## [1] 8.846154 36.538462 60.384615 78.846154 86.153846 89.230769
## [7] 94.615385 97.307692 99.230769 100.000000
Elaboración de la tabla con todas las variables.
tabla_gini <- cbind(xi,ni,Ni,un,M,pi,qi)
tabla_gini
## xi ni Ni un M pi qi
## [1,] 25 23 23 575 575 8.846154 1.480051
## [2,] 75 72 95 5400 5975 36.538462 15.379665
## [3,] 125 62 157 7750 13725 60.384615 35.328185
## [4,] 175 48 205 8400 22125 78.846154 56.949807
## [5,] 225 19 224 4275 26400 86.153846 67.953668
## [6,] 275 8 232 2200 28600 89.230769 73.616474
## [7,] 325 14 246 4550 33150 94.615385 85.328185
## [8,] 375 7 253 2625 35775 97.307692 92.084942
## [9,] 425 5 258 2125 37900 99.230769 97.554698
## [10,] 475 2 260 950 38850 100.000000 100.000000
Aplicación de la fórmula de Gini:
Gini <- sum(pi-qi)/(sum(pi)-100)
Gini
## [1] 0.1927013
Su autor fue Max O. Lorenz en 1905. Es una representación gráfica utilizada para mostrar la distribución relativa de una variable, por ejemplo los ingresos según hogares o personas. La curva representa:
Porcentaje acumulado del ingreso (\(pi\)).
Porcentaje acumulado de personas u hogares (\(qi\)).
La curva parte del origen (0,0) y termina en el punto (100,100).
Si el ingreso estuviera distribuido de manera perfectamente equitativa, la curva coincidiría con la línea de 45 grados que pasa por el origen.
Si existiera desigualdad perfecta, o sea, si un hogar o persona poseyera todo el ingreso, la curva coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría el punto (100,100).
En general la curva se encuentra en una situación intermedia entre estos dos extremos.
Cuanto más cerca de la diagonal, menor concentración/más homogeneidad en la distribución.
Cuanto más cerca de los ejes (parte inferior), mayor concentración/menor homogeneidad
En R podemos dibujarlo de manera manual:
plot(pi,qi,
type= "l")
lines(pi, qi,
col = 2,
lwd = 2,
type = "p")
legend("topleft", "curva Lorenz", col = 1:2, lty = 1, box.col = 1)
O también podemos dibujarlo a través de la función
curva.lorenz
del paquete ineq
library(ineq)
curva.lorenz <- Lc(xi, # vector con valores
ni) # vector con frecuencias
plot(curva.lorenz)
📝 ACTIVIDAD DE EVALUACIÓN CONTINUA :
Un aspecto frecuentemente analizado por la Geografía Agraria es el tamaño de las explotaciones agrarias. Hay regiones en las que predominan las grandes explotaciones (“latifundios”) mientras que en otras la propiedad está mucho más repartida (“minifundio”). Importa el fichero explotaciones_agrarias.csv. Crea con él un dataframe, calcula el índice de Gini para cada provincia y compáralos entre sí.
h1 <- length(ni1)
Ni1 <- cumsum(ni1)
un1 <-c(xi*ni1)
M1 <- cumsum(un1)
qi1 <- c(M1/sum(un1))*100
qi1
pi1 <- c(Ni1/sum(ni1))*100
pi1
# Tabla con todas las variables.
tabla_gini1 <- cbind(xi,ni1,Ni1,un1,M1,pi1,qi1)
tabla_gini1
# Aplicación de la fórmula de Gini:
Gini1 <- sum(pi1-qi1)/(sum(pi1)-100)
Gini1
h2 <- length(ni2)
Ni2 <- cumsum(ni2)
un2 <-c(xi*ni2)
M2 <- cumsum(un2)
qi2 <- c(M2/sum(un2))*100
pi2 <- c(Ni2/sum(ni2))*100
# Tabla con todas las variables.
tabla_gini2 <- cbind(xi,ni2,Ni2,un2,M2,pi2,qi2)
tabla_gini2
# Aplicación de la fórmula de Gini:
Gini2 <- sum(pi2-qi2)/(sum(pi2)-100)
Gini2
h3 <- length(ni3)
Ni3 <- cumsum(ni3)
un3 <-c(xi*ni3)
M3 <- cumsum(un3)
qi3 <- c(M3/sum(un3))*100
pi3 <- c(Ni3/sum(ni3))*100
# Tabla con todas las variables.
tabla_gini3 <- cbind(xi,ni3,Ni3,un3,M3,pi3,qi3)
tabla_gini3
# Aplicación de la fórmula de Gini:
Gini3 <- sum(pi3-qi3)/(sum(pi3)-100)
Gini3
rm(list=ls())