Explorando o 1º Datathon UFRGS

Este relatório é a descrição da minha experiência como pesquisadora e como integrante da banca avaliadora do Datathon realizado no prédio 43111 do Instituto de Matemática e Estatística (IME) da Universidade Federal de Rio Grande do Sul (UFRGS), nos dias 15, 16 e 17 de outubro de 2018. A programação do evento encontra-se no seguinte link.

Antecedentes e Objetivo do Evento:

O Departamento de Estatística da UFRGS, em comemoração dos 40 anos do curso de Bacharelado em Estatística e dentro das atividades da Semanística, realizou o convite toda a comunidade acadêmica, e demais interessados em análise de dados, a participar do 1º Datathon da UFRGS.

O 1º Datathon da UFRGS é um evento que visa proporcionar a estatísticos, matemáticos, cientistas da computação, cientistas políticos, jornalistas, publicitários, designers, programadores, hackers e todas as pessoas criativas engajadas, a criação colaborativa de soluções tecnológicas principalmente a partir do repositório de dados eleitorais do Tribunal Superior Eleitoral (TSE). Foi uma maratona de análise de dados em que as equipes propuseram alternativas para que dados eleitorais sejam disponibilizados com transparência e acessibilidade a qualquer cidadão.

Foram 2 dias de “mãos na massa” com palestras e oficinas de programação estatística utilizando o software R.

Dia I: 15/10/2018

O primeiro dia iniciou com a oficina “Pintando e bordando no R: ggplot2 e Rmarkdown” apresentado pelo Prof. Rodrigo C. P. dos Reis. Após o minicurso, então, o desafio foi lançado.

Foram formadas 4 equipes que começaram trabalhar na proposta apresentada logo no mesmo dia. A tabela amostra a distribuição das equipes e um resumo da cada proposta:

Depois das respectivas apresentações das propostas foi realizada a segunda oficina sobre o tema “Web Scrapping, Web Services e API’s — Extraindo dados através do R” ministrado por Lucas Godoy (Doutorando em Estatística pela UFMG).

Dia II: 16/10/2018

A maratona continuou as 13h com a presença das 4 equipes.

Foi criado um momento de compartilhamento de experiências e dificuldades. Cada equipe falou sobre as dificuldades encontradas e os participantes dos outros times aportaram sugestões e dicas. Alguns exemplos foram o uso de pacotes da ferramenta R, importação de dados em sistemas operacionais diferentes, uso do GitHub, etc.

Finalizado o momento de ajuda colaborativa, ministraram a terceira oficina sobre o tema “MapeaR: descomplicando a construção de mapas no R” ministrada via skype por Luís Gustavo Silva e Silva (Pós doutorado pela UFMG).

Dia III: 17/10/2018

Apresentação dos trabalhos

Foram apresentados os trabalhos das equipes “Mitos e Verdades” e “What If” para a comunidade acadêmica e a imprensa da UFRGS. As demais equipes relataram problemas na fase final da análise e decidiram não apresentar seus resultados.

A equipe “Mitos e Verdades” foi a primeira a apresentar o trabalho sobre a visualização dos votos do primeiro turno por nível de escolaridade. Os gráficos em mapas divididos por estados representaram especificamente os votos para os candidatos a presidência concorrentes para o segundo turno e permitiram ver que a maioria das pessoas com maior nível de escolaridade votaram no candidato Jair Bolsonaro, enquanto o nível de escolaridade dos votantes do candidato Haddad foi heterogêneo ressaltando uma maioria de pessoas com escolaridade baixa.

A segunda equipe a apresentar foi o “What If” com uma proposta mais elaborada e publicada https://sulzbach.shinyapps.io/datathon/. O aplicativo tem como objetivo facilitar a visualização dos dados de Receita e Despesas dos candidatos e partidos concorrentes nas Eleições do ano 2014. Facilitando também a pesquisa por um candidato ou partido específico. Uns dos gráficos principais representa a relação receita vs vitória e amostra que candidatos que gastaram mais em campanhas politicas tiveram mais chances de vitória.

A equipe escolhida como vencedor pela banca avaliadora foi “What If” por atingir melhor o objetivo do Datathon.

Considerações do evento

  1. O evento contou com a participação de estudantes de graduação e pós graduação da matemática, estatística e ciência da computação, divididos em quatro equipes.
  2. Foram utilizados os computadores da sala com conexão a Internet e ferramenta Rstudio instalado.
  3. Tempo aproximado de maratona presencial foi de 7 horas.
  4. Durante todo o evento os professores e um dos palestrantes auxiliaram as equipes.
  5. Com relação a frequência de participação em eventos Hackathon e Datathon a maioria mencionou que foi sua primeira participação.
  6. Os participantes acharam que o Datathon ajudou a compreender mais sobre análise de dados e visualização.
  7. Os participantes tiveram facilidade em entender a dinâmica do Datathon.
  8. O Datathon promoveu momentos de cooperação entre as pessoas que participaram. Além disso, mencionaram que a experiência com pessoas de outras áreas num evento Datathon, torna a análise de dados mais eficiente.
  9. Foi reconhecida a boa qualidade dos produtos apresentados apesar do curto prazo para a realização.

Em conclusão: O evento possibilitou trocas de conhecimentos e informações entre os organizadores, estudantes e profissionais de diversas áreas, e de diferentes níveis de programação computacional. Foi possível criar um ambiente criativo para discussão de soluções tecnológicas a problemas de obtenção e análise de dados.