Educational Data Mining & Data Science — Um Caminho de Solução para o Problema da Evasão

Gustavo Alexandre
Data Hackers
Published in
7 min readJan 10, 2020

Uma introdução a Educational Data Mining (EDM)

Falaê Galera Bonita, tudo massa?

Hoje, eu venho aqui compartilhar com vocês um pouco sobre um problema bastante significativo em contexto global, principalmente, em nosso país: a Evasão. Além de descrever sobre essa problemática, será apresentado, também, um pouco sobre Educational Data Mining (EDM) ou Mineração de Dados Educacionais, a fim de interligar esse domínio ao contexto de Data Science e promover uma agregação de tratativas ao problema em questão. Sendo assim, “vamos simbora” rumo ao que interessa! ;)

A Evasão no Ensino Superior

Figura 1. Tipos de Evasão (Fonte: Evasão nas Licenciaturas da UFG).

Segundo a Comissão Especial sobre Evasão do MEC, a evasão pode acontecer de três formas, conforme pôde ser visto na Figura 1. Cada uma dessas formas está descrita a seguir:

  • Abandono do curso: o aluno é desligado do curso que foi matriculado;
  • Abandono da instituição: o aluno desiste da instituição onde cursa graduação;
  • Abandono do sistema: o aluno abandona o ensino superior.

Com base nas definições trazidas, o problema de evasão assume enfoque quando seus números “saltam aos nossos olhos”. Segundo a Diretoria de Estatística Educacional do INEP, dentre as 13,5 milhões de vagas oferecidas em 2018; 3,6 milhões foram oriundas da evasão. No entanto, apenas 11,3% destas vagas foram preenchidas. Agora, correlacione essa informação sobre vagas com custo médio do aluno na educação superior pública brasileira que, de acordo com a OCDE (2016), é de US$13.539,90. Segue uma reportagem publicada em 2018 que detalha o contexto recente da evasão no Ensino Superior brasileiro.

“Somente 34% dos estudantes tiveram uma trajetória adequada durante o curso. Porém, dentre as desistências; 84,4% estavam matriculados em instituições privadas”

Diante disso, vamos pensar um pouco:

  • De que forma é possível minimizar os impactos da evasão no Ensino Superior?
  • Como é possível garantir que os investimentos em educação sejam feitos de forma eficiente?
  • Quais são os fatores que afetam a aprendizagem?
  • Como desenvolver sistemas educacionais mais eficazes?

Para responder perguntas como estas e tantas outras, surgiu a EDM — uma disciplina emergente, dedicada a explorar dados provenientes de contextos educacionais, por meio de técnicas computacionais, para entender melhor os alunos e os ambientes em que aprendem.

EDM — Educational Data Mining

O termo Data Mining ou "Mineração de dados", também conhecido como "Descoberta de Conhecimento em Bancos de Dados", ou KDD (do inglês, Knowledge Discovery in Databases), refere-se à disciplina que tem como objeto de estudo a obtenção de conhecimento a partir das informações analisadas através de um significativo volume de dados armazenados (Fayyad, 1996). As informações sobre a relação entre dados e, posteriormente a descoberta de conhecimento, podem ser muito úteis para realizar atividades de tomada de decisão (Baker, 2011). Sendo assim, a Mineração de dados tem sido aplicada em diversas áreas do conhecimento e, na última década obteve destaque com o grande volume de dados produzidos através do suporte tecnológico à educação: desde a gestão pedagógica, informatização dos processos de negócio, sistemas de apoio à aprendizagem até educação online (EAD — Ensino a Distância).

Muitos pesquisadores da área de Informática (em particular, Mineração de Dados e Aprendizado de Máquina) têm mostrado interesse em utilizar mineração de dados para investigar questões científicas na área de educação. Dentro deste contexto, surgiu uma nova área de pesquisa conhecida como “Mineração de Dados Educacionais” (do inglês, “Educational Data Mining”, ou EDM).

Segundo Baker, a EDM é definida como a área de pesquisa que tem como principal foco o desenvolvimento de métodos para explorar conjuntos de dados coletados em ambientes educacionais. Assim, é possível compreender de forma mais eficaz e adequada os alunos, o ambiente e o contexto nos quais a aprendizagem ocorre, além de outros fatores que influenciam esta aquisição de conhecimento. Por outro lado, é possível também identificar em que situação um tipo de abordagem (e.g. aprendizagem individual ou colaborativa) proporciona melhores benefícios educacionais ao aluno e, sobretudo, verificar se o mesmo encontra-se engajado ou não, a fim de personalizar o ambiente e os métodos de ensino para oferecer melhores condições de aprendizagem.

Buscando respostas para questões desse tipo, idealizamos uma forma onde fosse factível unificar os dados referentes aos alunos do Ensino Superior. Nesse momento, surge (depois de muitas pesquisas, risos) o conceito de EDM — área de conhecimento que explora algoritmos estatísticos, aprendizado de máquina e a mineração de dados no contexto educacional. A Figura 2, abaixo, elucida melhor a EDM, representando as relações entre as áreas mencionadas.

Figura 2. Principais áreas da EDM (Fonte: Romero & Ventura, 2013).

Segundo Romero & Ventura (2010), EDM possui requisitos específicos não presentes em outros domínios e, sobretudo, com a premissa de considerar os aspectos pedagógicos, o processo de aprendizagem e o aluno em si.

A comunidade de EDM vem crescendo de maneira enfática. Em 2008, surgiu a primeira conferência internacional sobre EDM: International Conference on Educational Data Mining, consolidada após uma série de eventos e workshops representativos realizados anualmente a partir de 2004. Em seguida, criou-se também o primeiro periódico específico para EDM: Journal of Educational Data Mining, que teve seu primeiro volume publicado em 2009. Além da consolidação dos principais, evento e periódico, na área de EDM, a comunidade ainda se fortaleceu também com a publicação de dois livros sobre o tema. O primeiro livro, lançado em 2006, foi Data Mining in e-learning; e o segundo, lançado em 2010, foi Handbook of Educational Data Mining.

No Brasil, as pesquisas neste tema têm alcançado destaque; porém ainda são poucos os trabalhos publicados nesta área de pesquisa. Um dos primeiros trabalhos sobre EDM no Brasil foi publicado por Brandão et al (2006), que efetuou uma análise de dados sobre a Informática na Educação. Outro trabalho pioneiro na EDM e de destaque no Brasil, foi apresentado por Pimentel e Omar (2006), o qual desenvolveu uma análise sobre os dados de desempenho dos alunos. Para destacar o posicionamento atual do Brasil, segue a Figura 3, que apresenta um gráfico na forma de ranking dos países que mais contribuíram para EDM entre os anos de 2013 até 2019, publicados na base Scopus.

Figura 3. Ranking de publicações em EDM entre os anos de 2013 até 2019.

Apesar de o Brasil estar entre os dez países, conforme o gráfico apresentado na Figura 3, a quantidade de trabalhos publicados ainda pode ser potencializada, principalmente quando se trata de um dos países com baixo desempenho nos indicadores de avaliação global da educação (PISA, OCDE). Sendo assim, este post busca apresentar para a comunidade de Data Science no Brasil, a EDM, a fim de possibilitar uma integração para desenvolver soluções que aprimorem a nossa educação.

Com o objetivo de divulgar esta área no Brasil, este artigo apresentou uma introdução sobre a EDM e uma breve visão sobre os benefícios que está área de conhecimento pode trazer ao sistema educacional brasileiro, desde a gestão pedagógica, processos de ensino e aprendizagem até EAD. Para quem gostou do tema, vale a pena conferir o estudo produzido por Santos et. al. (2018) sobre a EDM aplicada na Predição de Evasão, no qual são destacadas as pesquisas recentes sobre o assunto no Brasil e no mundo.

Então galera, acho que dei uma esticada no papo acadêmico bem maior do que eu imaginei (Foi mals aê ..).

Sobretudo, espero que compreendam, afinal a ideia era fundamentar a EDM. Uma área que tem contribuído muito para potencializar a educação, dinamizar o processo de aprendizagem e, por conseguinte, promover a Educação como objeto de análise — um alicerce imprescindível para o desenvolvimento e avanço da Ciência de Dados no nosso país e, acima de tudo, da nossa sociedade!

Bem, pessoal… Acho que por hoje é só! Vou ficar por aqui, mas eu prometo que volto (ou pelo menos tento voltar). No próximo conteúdo, pretendo apresentar uma solução na qual utilizei de técnicas da Engenharia de Dados e ETL para integrar distintos sistemas de informação acadêmicos. Essa iniciativa resultou em uma base de dados analítica na forma de um “Data Warehouse Educacional”. O objetivo dessa solução foi melhorar a compreensão perante o problema da evasão em uma das maiores instituições federais de ensino superior do Brasil: a UFF (Universidade Federal Fluminense). Para conhecer um pouco mais sobre a UFF e seus indicadores, acessem a página: "UFF em Números".

Então fica assim, Galera Bonita! Aquele abraço e até mais ..

Referências

Baker, R., Isotani, S. and Carvalho A. Mineração de dados educacionais: Oportunidades para o brasil. Brazilian Journal of Computers in Education 19(02), 03, 2011. https://br-ie.org/pub/index.php/rbie/article/view/1301

Brandão, M. F. R., Ramos, C. R. S., Tróccoli, B. T. Análise de agrupamento de escolas e Núcleos de Tecnologia Educacional: mineração na base de dados de avaliação do Programa Nacional de Informática na Educação, 366–374, 2006.

Fayyad, U., Piatetsky-Shapiro, G., Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), 37–37. https://www.aaai.org/ojs/index.php/aimagazine/article/view/1230/1131

Pimentel, E.P., Omar, N. Descobrindo Conhecimentos em Dados de Avaliação da Aprendizagem com Técnicas de Mineração de Dados. Workshop sobre Informática na Escola. Anais do Congresso da Sociedade Brasileira de Computação, 147–155, 2006. https://www.br-ie.org/pub/index.php/wie/article/view/885

Romero, C., Ventura, S. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), v. 40, n. 6, p. 601–618, 2010. https://ieeexplore.ieee.org/document/5524021

Romero, C., Ventura, S. Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 3, n. 1, p. 12–27, 2013. https://onlinelibrary.wiley.com/doi/abs/10.1002/widm.1075

Santos, G. A. S., Bordignon, A. L., Oliveira, S. L. G., Haddad, D. B., Brandão, D. N., & Belloze, K. T. (2018, October). A Brief Review about Educational Data Mining applied to Predict Student’s Dropout. In Anais da V Escola Regional de Sistemas de Informação do Rio de Janeiro (pp. 86–91). SBC.

--

--

Gustavo Alexandre
Data Hackers

Data Scientist | Núcleo de BI & Analytics @ TCE-RJ