Como se Manter Atualizado em Meio ao Imenso Conteúdo de Inovações Tecnológicas?

Big Data Brasil
Big Data Blog
Published in
4 min readDec 30, 2020
Photo by Patrick Tomasso on Unsplash

por Guilherme Oliveira Campos, Cientista de Dados na Big Data.

Ainda em 1996, Fayyad já dizia que a nossa capacidade de coletar e armazenar dados tinha ultrapassado em muito nossa capacidade humana de analisar e extrair conhecimento a partir deles. Hoje, vivemos em um mundo de superabundância de dados de fontes variadas, como, por exemplo, a Internet, sensores, sistemas de vigilância, imagens de satélite, diagnósticos hospitalares, entre outros. Dentro deste contexto, técnicas avançadas capazes de sumarizar, processar e transformar dados em conhecimento de uma forma inteligente e automatizada tornam-se primordiais para a evolução e, por esta razão, diversos pesquisadores contribuem para o avanço no estado da arte de algoritmos relacionados a ciência de dados.

Por Onde Começar?

Acompanhar inovações em ciência de dados não é uma tarefa simples. Anualmente, ocorrem inúmeras conferências nacionais e internacionais onde são debatidas a aplicabilidade de novas técnicas, a evolução e o aprimoramento de técnicas existentes e, inclusive, propostas para resolução de problemas antes insolúveis. Ao mesmo tempo, também ocorrem inovações através de artigos em revistas, livros, teses, workshops técnicos e publicações informais.

A fim de ter acesso a informações dos mais diversos trabalhos dos principais periódicos (e demais veículos de informação) podemos utilizar o DBLP, uma biblioteca on-line que fornece acesso gratuito a metadados e informações bibliográficas de alta qualidade sobre os principais periódicos de ciência da computação.

O repertório de trabalhos armazenados no DBLP é vasto. Até Setembro de 2020, eram:

  • 1.7 mil revistas
  • 5.2 mil conferências
  • 5.2 milhões de publicações

indexadas, onde aproximadamente 90% de todas as publicações armazenadas se enquadram em duas categorias de publicação:

  1. Artigos de conferência e workshop (50,93%)
  2. Artigos de revistas (38,92%).
Número de Publicações Indexadas no DBLP. Fonte: dblp.org

Vale ressaltar que o DBLP também indexa artigos de preprints eletrônicos, como, por exemplo, o arxiv

O DBLP é muito útil para acessar artigos científicos de forma fácil e centralizada. Porém, como identificar os trabalhos e periódicos mais relevantes e se manter atualizado em meio a tantas informações?

Como Buscar?

No Brasil, a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) disponibiliza uma plataforma denominada Sucupira, que tem como objetivo coletar informações, realizar análises e avaliações e ser a base de referência do Sistema Nacional de Pós-Graduação (SNPG) do Brasil. A Plataforma Sucupira disponibiliza uma avaliação de diversos veículos de publicação de pesquisas. A avaliação vai do pior ranking C até o melhor ranking A1.

Exemplo de Busca de Periódicos Através da Plataforma Sucupira

Outra forma identificar as melhores conferências e revistas é olhar o índice h5 do Google Scholar. Este índice é definido observando a abrangência e a influência que o veículo de informação possui. Espera-se que os trabalhos publicados nas melhores conferências e revistas sejam citados por diversos outros trabalhos. Olhando para a área de Análise e Mineração de Dados, o top 5 periódicos mais relevantes são:

  • ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
  • IEEE Transactions on Knowledge and Data Engineering
  • International Conference on Artificial Intelligence and Statistics
  • ACM International Conference on Web Search and Data Mining
  • IEEE International Conference on Data Mining Workshop

Além dos rankings mencionados anteriormente, podemos recorrer a outras ferramentas que facilitam o acesso de usuários a artigos mais relevantes em ciência de dados. Por exemplo:

  • Papers with Code. Disponibiliza os artigos mais relevantes em cada subárea que envolva Inteligência Artificial, Ciência de Dados e Computação no geral. Também, permite ao usuário acessar às tabelas de avaliação e aos códigos presentes em cada artigo. Ao total são mais de 34 mil artigos com códigos disponı́veis na plataforma.
  • Distill. Web-journal cujo objetivo é realizar publicações focadas na compreensão do leitor e facilidade de visualização através de ferramentas Web. A plataforma também publica explicações de artigos cientı́ficos relevantes e complexos em aprendizado de máquina para a comunidade (afinal, boa parte dos artigos científicos publicados em veículos renomados não são gratuitos).

Conclusão

Não é nada fácil manter-se atualizado em meio à grande quantidade de trabalhos científicos que são publicados anualmente. Portanto, o foco deve ser pesquisar nas principais conferências da sua área de atuação e algumas ferramentas gratuitas nos ajudam a realizar uma boa análise nos artigos de maior relevância.

Adquirir conhecimento e evitar a estagnação promovendo o P&D quando olhamos no âmbito empresarial é a chave para o sucesso. Os ganhos a longo prazo são nítidos e o universo de novidades é infinito. Como disse Steve Jobs:

“A inovação distingue um líder de um seguidor”

--

--