INTRODUCCIÓN

Son diferentes indicadores del grado de distribución de la variable y cuantifican el grado de igualdad en el reparto de los valores de una variable. Los más importantes son:

Índice de Gini
Curva de Lorenz

ÍNDICE DE GINI

Es un índice desarrollado originalmente por Corrado Gini para medir la desigualdad en los ingresos de los habitantes de un país, pero puede utilizarse para medir cualquier forma de distribución desigual. Es un número entre 0 y 1, donde

El valor 0 se corresponde con la perfecta igualdad (todos tienen los mismos ingresos).
El valor 1 se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno).

Índice de Gini 2015

Supongamos la siguiente distribución de rentas en un país cualquiera. Las rentas han sido agrupadas en una serie de categorías, cuyos límites serían \(L_{i1}-L_i\), \(x_i\) la marca de cada clase, \(n_i\) su frecuencia absoluta y \(N_i\) su frecuencia absoluta acumulada.

Ejemplo desarrollado del índice de Gini

Finalmente,

Ejemplo desarrollado del índice de Gini

✅ EJEMPLO:

Datos de partida

xi <-c(25,75,125,175,225,275,325,375,425,475)                                   # Vector con valores (en este caso, marcas de clase)
ni <-c(23,72,62,48,19,8,14,7,5,2)                                               # Vector con frecuencias

h <-length(ni) 
h

## [1] 10

Ni <-cumsum(ni)
Ni

##  [1]  23  95 157 205 224 232 246 253 258 260

un <-c(xi*ni)
un

##  [1]  575 5400 7750 8400 4275 2200 4550 2625 2125  950

M <-cumsum(un)
M

##  [1]   575  5975 13725 22125 26400 28600 33150 35775 37900 38850

qi <-c(M/sum(un))*100
qi

##  [1]   1.480051  15.379665  35.328185  56.949807  67.953668  73.616474
##  [7]  85.328185  92.084942  97.554698 100.000000

pi <-c(Ni/sum(ni))*100
pi

##  [1]   8.846154  36.538462  60.384615  78.846154  86.153846  89.230769
##  [7]  94.615385  97.307692  99.230769 100.000000

Elaboración de la tabla con todas las variables.

tabla_gini <- cbind(xi,ni,Ni,un,M,pi,qi)
tabla_gini

##        xi ni  Ni   un     M         pi         qi
##  [1,]  25 23  23  575   575   8.846154   1.480051
##  [2,]  75 72  95 5400  5975  36.538462  15.379665
##  [3,] 125 62 157 7750 13725  60.384615  35.328185
##  [4,] 175 48 205 8400 22125  78.846154  56.949807
##  [5,] 225 19 224 4275 26400  86.153846  67.953668
##  [6,] 275  8 232 2200 28600  89.230769  73.616474
##  [7,] 325 14 246 4550 33150  94.615385  85.328185
##  [8,] 375  7 253 2625 35775  97.307692  92.084942
##  [9,] 425  5 258 2125 37900  99.230769  97.554698
## [10,] 475  2 260  950 38850 100.000000 100.000000

Aplicación de la fórmula de Gini:

Gini <- sum(pi-qi)/(sum(pi)-100)
Gini

## [1] 0.1927013

CURVA DE LORENZ

Su autor fue Max O. Lorenz en 1905. Es una representación gráfica utilizada para mostrar la distribución relativa de una variable, por ejemplo los ingresos según hogares o personas. La curva representa:

Porcentaje acumulado del ingreso (\(pi\)).
Porcentaje acumulado de personas u hogares (\(qi\)).

La curva parte del origen (0,0) y termina en el punto (100,100).

Si el ingreso estuviera distribuido de manera perfectamente equitativa, la curva coincidiría con la línea de 45 grados que pasa por el origen.
Si existiera desigualdad perfecta, o sea, si un hogar o persona poseyera todo el ingreso, la curva coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría el punto (100,100).

En general la curva se encuentra en una situación intermedia entre estos dos extremos.

Cuanto más cerca de la diagonal, menor concentración/más homogeneidad en la distribución.
Cuanto más cerca de los ejes (parte inferior), mayor concentración/menor homogeneidad

En R podemos dibujarlo de manera manual:

plot(pi,qi, 
     type= "l")
lines(pi, qi, 
      col = 2, 
      lwd = 2, 
      type = "p")
legend("topleft", "curva Lorenz", col = 1:2, lty = 1, box.col = 1)

O también podemos dibujarlo a través de la función curva.lorenz del paquete ineq

library(ineq)
curva.lorenz <- Lc(xi,                   # vector con valores
                   ni)                   # vector con frecuencias
plot(curva.lorenz)

📝 ACTIVIDAD DE CLASE :

Un aspecto frecuentemente analizado por la Geografía Agraria es el tamaño de las explotaciones agrarias. Hay regiones en las que predominan las grandes explotaciones (“latifundios”) mientras que en otras la propiedad está mucho más repartida (“minifundio”). Importa el fichero explotaciones_agrarias.csv. Crea con él un dataframe, calcula el índice de Gini para cada provincia y compáralos entre sí.

datos <- read.csv2('https://personales.unican.es/rasillad/docencia/G2040/TEMA_5/explotaciones_agrarias.csv')
attach(datos)                                    # Función que informa a R que se trabajará con el dataframe datos hasta nueva orden

Estación 1
Estacion 2
Estacion 3
¿Cuál es la provincia en la que domina la pequeña explotación? ¿y cuál tiene un índice de Gini más alto?

rm(list=ls())

TEMA 4: ESDA: ESTADÍSTICOS DE CONCENTRACIÓN (IGUALDAD)

Domingo Rasilla y Francisco Conde

06 noviembre, 2025

INTRODUCCIÓN

ÍNDICE DE GINI

CURVA DE LORENZ