REINTERPRETANDO O ÍNDICE DE GINI
(Rodrigo Peñaloza, 5-VII-2016)

Neste texto eu apresento uma forma alternativa de interpretar o índice de Gini: a teoria dual de Henry Theil das medidas de concentração. A ideia é antiga, deve-se ao econometrista Henry Theil ainda nos anos 1960, mas ele se restringiu à entropia. Vou ilustrar a ideia de Theil aplicando-a à variância e depois passarei ao índice de Gini.

Uma das principais evidências de que as condições de vida da sociedade brasileira evoluíram significativamente na primeira década deste milênio é a queda do índice de Gini para o atual patamar de 0.54. Na década de 1990, o índice de Gini manteve-se praticamente estável entre 0.58 e 0.60. Foi somente na primeira década deste século que o índice de Gini apresentou uma queda significativa, chegando a 0.54, segundo dados da PNAD até 2009. Normalmente, explica-se esse número à sociedade brasileira dizendo-se que, quanto mais próximo de zero, menor é a desigualdade distribucional de renda e que, quanto mais próximo da unidade, pior é a desigualdade de renda. Essa explicação é inteligível, mas não consegue evitar um sentimento de indefinição quanto ao que isso realmente significa, pois qualquer índice de concentração, não apenas o de Gini, basicamente diz a mesma coisa. Outra forma de explicar é pela área entre a curva de Lorenz e a diagonal do quadrado unitário. Temos de convir que nenhuma dessas duas explicações esclarece realmente o significado. Uma diz o óbvio que toda medida de concentração diz; outra não é compreensível pelo cidadão sem conhecimentos mínimos de geometria euclidiana e representação gráfica de dados estatísticos.

O objetivo desta nota é ajudar na compreensão do que seja o índice de Gini, de modo a termos uma ideia mais precisa do significado social de sua redução. Para isso, apresento a teoria dual das medidas de concentração proposta por Theil (1967), que a aplicou essencialmente ao conceito de entropia. Souza (1974 e 1977) e Hoffmann (1998) apresentaram aplicações da teoria dual de concentração a outras medidas de variabilidade ou concentração, como a variância e o índice de Gini. Guerra, Peñaloza & Tabak (2009) aplicaram o dual do índice de Hirschmann-Herfindahl à concentração bancária no Brasil. Peñaloza (2012a e 2012b) generalizou essa teoria para variáveis nominais e ordinais, aplicando-a a medidas de pobreza multidimensionais e à teoria das capacidades de Amartya Sen em Development as Freedom.

Para melhor entendermos o sentido das medidas duais, vejamos qual foi o raciocínio inicial de Theil. A dispersão de qualquer série é mais bem compreendida se a substituirmos por uma série de realizações de uma variável binária com a mesma dispersão e o mesmo total. Suponha, por exemplo, que {x(1),…,x(n)} é uma série de rendas familiares reportadas por n famílias. Escolhendo adequadamente uma unidade de conta, geramos uma série de n = 100 valores a partir da distribuição uniforme sobre [0,1], como na figura abaixo:

Em vez da entropia, a medida estudada por Theil, considere a variância. A variância da série é σ² = 0.131229309 e sua média é m = 0.478112749. Se tivéssemos duas unidades familiares representativas ou duas classes sociais, a classe pobre com renda zero e a classe rica com renda positiva c, com respectivos pesos d e 1 - d, tais que a renda total fosse a mesma e a variância a mesma, então a única solução será d(σ²) = σ²/(σ²+m²) = 0.36471 e c = m/d = 1.3109. O número d(σ²) é o dual da variância σ². Esse outro caso é descrito na figura a seguir:

Observe que é muito mais fácil inteligir a variabilidade ou, alternativamente, a concentração da série mediante a distribuição dual. Cada medida de concentração ou de variabilidade tem seu dual.

O fato relevante é que o índice de Gini, que designaremos por g, é a única medida de concentração que é auto-dual, ou seja, d(g) = g, de forma que, mediante a interpretação dual, podemos dizer que o índice de Gini de 0.54 do Brasil é o mesmo índice que encontraríamos se toda renda da população estivesse concentrada equanimemente nas mãos de 46% da população e 54% estivessem na miséria absoluta. Na série dual, diminuir a proporção de pobres é equivalente a diminuir a desigualdade de renda. Dessa forma, se a redução do índice de Gini de 0.6 para 0.54 tivesse que ser reinterpretada como redução de pobreza, então a menor desigualdade de renda alcançada na última década seria equivalente à retirada de 6% da população da pobreza. É importante, entretanto, não confundir o que foi dito com a redução da pobreza pelo critério do headcount index (a proporção de pobres).

Entre as vantagens imediatas do conceito de dual, podem ser citadas as seguintes: (i) sendo d uma fração própria, ele também é um índice de concentração, mas é normalizado e adimensional; (ii) a sensibilidade de qualquer medida de variabilidade V em relação às observações originais pode ser estudada através do seu dual d(V); (iii) as várias medidas de concentração podem ser comparadas mediante os seus duais; (iv) podemos definir um conceito de equivalência entre medidas de concentração por meio da noção de dual; (v) a noção de dual elimina a influência do tamanho da série estatística sobre o valor da variabilidade, além de possuir a óbvia vantagem de ser um método universal de obtenção de medidas padronizadas.

O dual do índice de Gini nos dá uma interpretação alternativa e muito mais rica do que o próprio índice de Gini é capaz de, sozinho, fornecer. Com efeito, recorde que o índice de Gini, de acordo com a interpretação original, é a área entre a curva de Lorenz e a bissetriz igualitária do quadrado unitário relativamente à área do triângulo sob a bissetriz, medindo assim a posição da concentração da série relativamente às posições extremas de igualdade e desigualdade absolutas. Tendo sido mostrado que o índice de Gini é auto-dual, a informação que ele realmente contém é que a concentração da série subjacente ao índice — digamos, uma série de distribuição da riqueza em uma sociedade — é equivalente à concentração em que uma proporção da sociedade igual ao índice de Gini encontra-se na indigência absoluta, ao passo que a proporção restante se apropria de toda a riqueza. A interpretação dual tem, assim, um significado social bastante mais profundo e certamente, sob a dualização, a desigualdade social torna-se mais nítida.

Durante o primeiro governo Lula, graças tanto à estabilização monetária promovida no governo FHC como às políticas sociais de redistribuição de renda, o índice de Gini do Brasil apresentou uma queda significativa, passando de algo em torno de g = 0.6 para o patamar atual de g = 0.54. Dessa forma, a desigualdade de renda no Brasil é equivalente à desigualdade de renda que teríamos em um país cuja riqueza fosse a mesma do Brasil, mas em que 46% detivessem equanimemente a totalidade da renda e 54% não detivessem coisa alguma. Do ponto de vista da informação estatística fornecida pelo índice de Gini, os dois países são indistinguíveis.

Referências

1. Guerra, S., Peñaloza, R. & Tabak, B. (2009): “Banking concentration and the price-concentration relationship: the case of Brazil”. International Journal of Accounting and Finance, 1(4): 415–435.
2. Hoffmann, R. (1998): Distribuição de Renda: Medidas de Desigualdade e Pobreza. EDUSP, São Paulo.
3. Peñaloza, R. (2012a): “Measuring the quality of tourism: a multidimensional index based on ordinal variables with endogenous weights”, 6th International Conference “An Enterprise odyssey: Corporate Governance and Public Policy — Path to Sustainable Future”, Šibenik, Croatia, June 12–16, 2012.
4. Peñaloza, R. (2012b): “Measurement of Education as an ordinal variable: towards a measure of human development based on the capability approach”. KDI School — Korea Development Institute, KGLF Program.
5. Souza, J. (1974): “Dualidade e concentração”. II Encontro Anual da ANPEC, CEDEPLAR-UFMG.
6. Souza, J. (1977): Estatística Econômica e Social. Editora Campus, Rio de Janeiro.
7. Theil, H. (1967): Economics and Information Theory. Rand McNally, Chicago.

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.