Qual o melhor país para se viver?

Caio Rocha
Oncase
Published in
12 min readOct 24, 2018

--

No Brasil, mais de 60% dos jovens tem interesse em sair do país. A grande questão à respeito disso, trata-se das grandes confusões político-econômicas no Brasil todo. Porém, como um jovem poderia se decidir sobre qual destino ele deveria escolher, ao sair do país? Nos destinos mais frequentes dos brasileiros, destacam-se principalmente os Estados Unidos e Portugal. Porém, será que esses países são mesmo os ideais para se viver?

Como não poderia ser diferente, nós da Oncase escolhemos guiar aqueles que estão indecisos tomando uma decisão data-driven. Neste post, vamos falar sobre como extrair insights e como realizar análises de forma descritiva e concisa a respeito de dados das nações do mundo inteiro, para que possamos decidir qual o melhor país para se viver. Os dados consistem em demografias gerais obtidas sobre cada nação em geral.

Sobre as Análises

As dimensões dos dados analisados consistem tanto em dimensões simples como número de habitantes e área do país em metros quadrados quanto em dimensões mais elaboradas, como porcentagem da agricultura na economia, porcentagem de terrenos destinados à plantação, etc. Os dados podem ser acessados na plataforma pública do Kaggle. O trabalho completo com as análises se encontra no github.

As dimensões que analisaremos serão as mais definitivas para a decisão de escolher um país para morar: a renda per capita, a mortalidade e a hospitalidade do povo local. Além disso, analisaremos os dados por meio da perspectiva de agrupamentos, vendo a similaridade dos países entre si por suas características demográficas. Começamos, então, com renda per capita.

1. Renda per Capita

Uma coisa interessante a respeito da base que muitos podem estar se perguntando agora é como é a distribuição de renda ao redor do mundo. Para responder essa pergunta, podemos analisar de forma exploratória os dados, vendo inicialmente a média por região do mundo.

Renda per capita média por região

Com isso já vemos consistência com o esperado: Maior parte da renda no oeste europeu e na América do Norte, com média de 26500 dólares por pessoa por ano, enquanto na África Subsariana temos uma média de 2300 dólares por pessoa por ano, que é menos de um décimo da média das regiões mais desenvolvidas. Para melhor visualizarmos a distribuição, a escolha ideal a se fazer é plotar a própria:

Distribuição da renda per capita ao redor do mundo.

O que notamos de início, é que a maior parte dos países tem renda entre 0 e 10000, e que bruscamente a frequência diminui em cerca dos 15000, o que mostra que poucos países tem de fato mais que 15000 dólares de renda per capita por ano. Outra coisa interessante, é a leve saliência entre 50000 e 60000, o que nos leva a ver qual país teria renda per capita acima de 50000 dólares por ano.(OBS: O gráfico apresenta intervalo chegando até -10000, mas isso acontece ao gerarmos um KDEPlot, que é uma estimativa de densidade de uma população).

Demografias de Luxemburgo

Luxemburgo, país do oeste europeu, é o país com maior renda per capita, com taxa de alfabetização de 100% e migração positiva. Um fato que influencia essa renda per capita ser tão alta, é o fato da população ser pequena, menos de meio milhão de habitantes. Para termos uma noção da renda do país, o salário mínimo do país é 1800 euros.

Para melhor analisarmos essa distribuição, podemos dividir os dados em quartos e analisar cada parte separadamente, ordenadas conforme a renda. Ou seja, as primeiras partes terão renda menor, e as últimas terão renda maior.

Começando pelos dados no primeiro quarto, vamos ver como se distribuem os países

Distribuição da renda per capita do primeiro quarto

Nota-se, que a maior frequência é entre 500 dólares por ano e 100 dólares por ano, o que destoa bastante da renda média por região, como vimos anteriormente. Para averiguarmos a participação de cada região nessa parte, vamos usar um contador, para contarmos quantos países de cada região estão na parte.

Contagem de regiões no primeiro quarto

Uma coisa óbvia que podemos observar de imediato é a ausência de qualquer país da Europa, tanto do leste quanto do oeste e de países da América do norte. Porém, países da Oceania, um continente conhecido pelo desenvolvimento, estão presentes nessa parte. Por isso, veremos quais são esses países:

Países da Oceania no primeiro quarto

Esses países são pequenas ilhas da Oceania que possuem baixa população, como podemos ver pelos dados. Porém, o fato da Oceania não ser conhecida por a baixa renda que essas ilhas possuem advém da colonização inglesa, que oprimiu muitos dos povos dessas pequenas ilhas, que ainda sofrem por isso, além de ter impulsionado o desenvolvimento da Austrália, pelo qual a Oceania é conhecida.

Agora, vamos analisar o segundo quarto, os países com renda per capita média-baixa.

Distribuição da renda per capita do segundo quarto

Vemos aqui que há maior “equilíbrio” em relação aos 25% anterior, uma vez que o intervalo é maior e que a frequência é um pouco mais distribuída. Vejamos agora quais países pertencem a esse quartil.

Contagem de regiões do segundo quarto.

Uma diferença significativa dessa contagem para anterior é a presença de países do leste europeu. Apesar de não ser onde há a maior concentração de renda da Europa, tem-se a imagem do continente todo como um lugar desenvolvido. Por isso, averiguamos quais são esses países.

Países da Europa do segundo quarto.

Agora que sabemos quais são esses países, podemos buscar as razões pelas quais os mesmos estão no quarto. O principal motivo desses países serem discrepantes de sua região consiste no conflito entre os dois países, originário das guerras iugoslavas. É interessante notar que ambos os países possuem migrações negativas, indicando evasão.

Vamos agora analisar o terceiro quarto:

Distribuição de renda dos países da terceira parte

O largo intervalo apresentado no gráfico mostra que a renda do mundo todo se concentra em poucos países. Vemos também o pico do gráfico pouco antes de 7500, o que indica a grande quantidade de países com essa renda per capita anual. Vejamos agora a contagem de cada região para esse quarto.

Contagem de regiões do terceiro quarto

Esse talvez seja uma das partes mais equilibradas em termos de distribuição de regiões, por vermos tanto Europa quanto África subsariana, apesar de ser apenas leste europeu. O que chama atenção, mesmo com tamanho intervalo, é a presença de países da África subsariana. Vejamos agora quais são esses países.

Países da África subsariana pertencentes ao terceiro quarto

Os dados mostram que os países são discrepantes entre si, não apenas por mostrar inconsistência na própria região, como também por boa parte dos países da África subsariana estarem em outras partes, principalmente os anteriores.

Por último, vamos analisar os últimos 25%.

Distribuição de renda dos 25% países mais ricos

Com o intervalo ainda maior que o anterior, podemos ver que há uma discrepância até mesmo entre países com maior renda per capita. A contagem de cada região para esse quarto é dada a seguir.

Contagem de cada região.

Vemos aqui, que há consistência nesses 25%, apesar do grande intervalo observado no gráfico anterior. Isso é visível pelo fato da maioria dos países dessa parte consistir em países europeus, além dos países da Oceania, América do Norte e do Oriente Médio, que possuem boa parte do mercado de petróleo.

Países do Oriente Médio pertencentes aos últimos 25%.

Com isso, conseguimos concluir que a distribuição de renda não tem padrões tão claros a respeito de região, uma vez que conseguimos achar países europeus em pelo menos três quatis diferentes, enquanto muitos podiam pensar que só se encontrariam na parte mais alta, nos últimos 25%.

Por isso, apesar da região ser um fator que muitos podem estar considerando unicamente ao se mudar, ele não deve ser o único a ser analisado. Por exemplo: se jovens acham um ótimo e barato apartamento na Sérvia, muitos podem simplesmente ir para lá por ser um país europeu, sem saber dos conflitos nos quais o país está envolvido.

Analisando apenas a renda per capita, fica óbvio que os países ideais para se viver são os mais conhecidos pela qualidade de vida: países do oeste europeu como França, Espanha, Inglaterra, Alemanha ou da América do Norte, como Estados Unidos e Canadá.

Uma outra coisa bastante interessante que podemos averiguar é quais regiões tem taxas de mortalidade alta, além de analisar o que pode indicar a alta mortalidade de um país, ou mesmo a baixa.

2. Mortalidade

Podemos começar a fazer isso plotando um diagrama de caixas, conhecido em inglês e nos pacotes de software como boxplot.

Diagrama de caixas da mortalidade de cada região.

O que podemos observar logo de início, é o destaque para a África, o que é esperado uma vez que é o continente de maior subdesenvolvimento de todos. O que é curioso, e contra-intuitivo é que o norte da África se mostra bem menos significativo que a África subsariana. Isso se deve a um declínio grande nos últimos anos da mortalidade na região(principalmente mortalidade infantil), se aproximando muito das regiões mais desenvolvidas, Como mostra o gráfico a seguir.

Fonte: http://blogs.worldbank.org/arabvoices/decline-child-mortality-rates-middle-east-north-africa-success-story

Além disso, nota-se a baixa mortalidade na América Latina, o que para muitos não é óbvio, uma vez que muitos dos países presentes na mesma são associados ao subdesenvolvimento.

Claro, temos valores destoantes, e os mesmos mostram maior taxa de mortalidade, mas o intervalo de mortalidade da América Latina é menor que o do leste europeu, por exemplo. Para termos maior noção do porquê de cada taxa de mortalidade ser assim, verifiquemos analisando a correlação de pearson da taxa de mortalidade com cada um dos outros atributos. Após isso, plotamos os gráficos de regressão da menor e da maior correlação com a taxa de mortalidade.

Regressão linear da taxa de mortalidade com a taxa de mortalidade infantil

Apesar de ser a maior correlação, essa influência é, de certa forma, óbvia, uma vez que o cálculo de uma medida leva em consideração a outra, o que de fato afeta linearmente.

Regressão linear da taxa de mortalidade com a taxa de alfabetização

Já esse gráfico nos mostra algo muito mais interessante: uma medida de educação influencia negativamente a taxa de mortalidade. Isso faz bastante sentido se analisarmos de forma mais indireta: Quanto mais pessoas educadas em um país, menor a chance de alguém morrer por falta de instrução, por erros manuais ou mesmo por erros médicos.

Um país com alta taxa de mortalidade não é o destino ideal para jovens buscando um futuro melhor. Por isso, países com alta taxa de alfabetização, como Chile e Costa Rica, mesmo ainda em transição(em desenvolvimento), podem ser opções viáveis, uma vez que tem baixo custo para moradia, e baixa mortalidade, o que indica uma boa segurança.

Porém, olhando apenas para esses dois atributos não conseguimos enxergar consequências diretas de conflitos políticos. Países com baixa mortalidade e alta alfabetização incluem países com qualidade de vida muito defasada, como Santa Helena, na África.

3. Agrupamento

Os países podem ser vistos sob diversas perspectivas. Uma forma comum de nos referirmos aos países é como países com alto desenvolvimento ou baixo desenvolvimento. Uma questão que pode afligir muitos ao buscar um novo destino é saber a prospecção da economia de um país, ou mesmo o custo de vida de um país. As características de um país desenvolvido ou subdesenvolvido podem variar sob a perspectiva de quem quer se mudar. Porém, isso pode ser melhor observado ao agruparmos os países.

Para isso, usaremos o K-Means, algoritmo tradicional de agrupamento, e com isso poderemos observar melhor as características de cada “classe” de país. Nesse algoritmo, podemos escolher em quantos grupos queremos dividir os dados. Experimentalmente, a melhor avaliação de separação para esses dados resultou em dois grupos. Isso mostra que os próprios dados são melhor separados em um grupo de países desenvolvidos e um grupo de países subdesenvolvidos. Para melhor vermos a separação, e comprovar que os mesmo se dividem em subdesenvolvido e desenvolvido, podemos usar novamente a classe Counter para vermos a contagem de cada região em cada grupo.

Grupo 0: países desenvolvidos
Grupo 1: países subdesenvolvidos

Com essas contagens, fica bem mais claro que os países são divididos em desenvolvidos e subdesenvolvidos. Se observarmos os grupos sob algumas perspectivas, podemos averiguar algumas verdades sobre os mesmos.

Grupos sob renda per capita e taxa de mortalidade. Vermelho: desenvolvido, Azul: subdesenvolvido

Como podemos ver, o grupo desenvolvido apresenta grande consistência em relação as duas características: renda per capita alta e sempre no mesmo intervalo, exceto um único ponto destoante(Luxemburgo). Já o grupo subdesenvolvido, apesar de mostrar consistência em relação à renda per capita, tem grande disparidade em relação à taxa de mortalidade, variando de menos de 5 até 30%.

Grupos sob renda per capita e alfabetização. Vermelho: desenvolvido, Azul: subdesenvolvido

Na imagem acima, vemos novamente que há inconsistência nos países subdesenvolvidos, uma vez que os mesmos tem uma taxa de alfabetização bastante variante, apesar da renda per capita ser consistente e se manter na mesma faixa de preço. Os países desenvolvidos, por sua vez tem baixa variação em termos de alfabetização. Análises como essas reiteram o fato de que para se escolher um país não basta olhar apenas para uma característica do mesmo, pois vários fatores precisam ser levados em conta.

4. Hospitalidade

Uma coisa que todos devem atentar na hora de migrar para outro país é a recepção ou hospitalidade do país com imigrantes. Essas questões devem ser levadas em consideração pois muitos países tem excelentes condições de vida, porém não tem muita receptividade, como é o caso dos Estados Unidos. No caso do nosso conjunto de dados, a variável mais associada a isso é a migração(net migration). Ao analisar a correlação da mesma com a taxa de natalidade, vemos uma correlação negativa:

O gráfico de regressão mostra, apesar da grande quantidade de países de migração neutra(0), que quanto menor a taxa de natalidade, maior a imigração no mesmo. Isso mostra que países com menor taxa de natalidade tem mais chances de receber imigrantes que países com alta taxa de natalidade, como a China. Por isso países como o Canadá são tão populares para imigração de muitos brasileiros nos últimos anos.

Esse outro gráfico nos mostra algo interessante. A correlação negativa entre alfabetização e taxa de natalidade mostra que quanto maior a “educação” de um país, menor a taxa de natalidade do mesmo. Como vimos anteriormente, quanto menor a alfabetização, menor a mortalidade também. Ou seja, além de menos perigosos, países com alta porcentagem de alfabetização também são propensos, de forma indireta, a receber imigrantes. Claro que casos como o dos Estados Unidos existem, bem como a China, que possuem altos índices de alfabetização. Porém, no geral, países com alta taxa de alfabetização são os melhores para se viver.

Seguindo esse ponto, para escolher um país para viver, devemos observar principalmente a taxa de natalidade do mesmo. Além disso, é importante vermos a renda per capita, a taxa de alfabetização e a taxa de mortalidade.

Conclusão

Vistos os gráficos de densidade acima, podemos observar que a maioria dos países tem taxa de alfabetização entre 80 e 100%, o que é bastante alto. Além disso, a maioria dos países tem taxa de natalidade entre 10 e 20 por mil. Visto isso, vamos buscar países com alta alfabetização(maiores que 90%) e taxa de natalidade baixa(abaixo de 10 por mil). Além, disso filtramos também por migração, obtendo os países com migração positiva, uma vez que uma evasão em países não é interessante por quaisquer motivos que seja a mesma.

Os países resultantes são os seguintes

Como poderíamos imaginar, países do oeste europeu são predominantes. Porém, alguns países como Eslovênia, Rússia, Hungria e Croácia tem características interessantes e inesperadas para a imigração. Outra coisa que notamos é a presença de um dos destinos favoritos da imigração dos brasileiros nos últimos anos, o Canadá. Dentre todos retornados, o Canadá e os países previamente citados, junto com Grécia, Espanha e Áustria, se mostram os ideais para os brasileiros, tanto por grandes oportunidades de trabalho quanto pelo baixo custo de vida.

--

--