Como foi palestrar no TDC

Alana Domit Bittar
Aurum Tech
Published in
6 min readMay 9, 2019

--

source: The Developer’s Conference via Facebook

Depois de participar do The Developer’s Conference (TDC) Florianópolis como parte do público em 2017 e 2018, neste ano decidi submeter um paper — uma talk, palestra. O TDC é um evento relacionado ao desenvolvimento de software que ocorre em Florianópolis e outras cidades do Brasil e contém trilhas de palestras e workshops, além de espaços para debates e crianças. Esta última edição foi do dia 23 ao dia 27 de abril, com várias trilhas simultâneas em cada dia.

Cada trilha possui um tema específico, sendo que a da minha palestra foi a de Python. Aqui na Aurum temos um time de extração, processamento e análise de dados, do qual participo, apelidado de robôs, que usa principalmente a linguagem Python para desenvolver suas soluções. Ela não é a única, mas devido ao ferramental robusto disponível para nossas atividades em suas bibliotecas padrões e externas, tem sido a de uso mais frequente. Para minha palestra, escolhi como tema uma dessas bibliotecas, a lxml, que utilizamos para parsear HTMLs alguns meses atrás.

source: PSF

lxml é na verdade um binding para duas outras bibliotecas escritas em C, libxml2 e libxslt. Já existiam outros bindings quando a lxml foi criada, porém os criadores os consideravam complexos — incluem gerenciamento de memória manual (!) — e pouco pythônicos. Ela serve para parsear, consertar, construir documentos XML e HTML e para extrair dados dos mesmos. Normalmente algo mais comum como Beautiful Soup — que, aliás, é construída em cima da lxml — , é o suficiente para parsear com sucesso um HTML, mas não quando seu HTML é gigante. Por ser um binding para C, lxml consegue parsear e atravessar a árvore de grandes elementos em poucos segundos. Com um documento de tamanho “comum”, não será sentida grande diferença em relação a Beautiful Soup, mas, para o nosso caso, a adoção do lxml foi necessária.

source: lxml

Você pode estar se perguntando por que tínhamos documentos HTML gigantescos para parsear. Na realidade, esses documentos estavam originalmente no formato PDF e foram transformados, de modo que ficasse mais fácil extrair suas informações. Sua estrutura era bem organizada em parágrafos lógicos, então poder navegar por divs e parágrafos ajudava muito na busca das informações desejadas. Na palestra procurei mostrar as principais funções relacionadas a parse e extração de documentos HTML, mas lxml é um toolkit muito completo, e muitas outras funcionalidades estão disponíveis. Se quiser saber mais, a palestra está disponível neste repositório do GitHub com instruções no README, e a documentação completa se encontra aqui.

Voltando para o TDC, durante o período do chamado Call4Papers, submeti a palestra com esse assunto. Para tal, precisei fornecer uma descrição para o público, uma mini biografia minha, o tempo estimado e uma explicação sobre a motivação da palestra, além de uma foto pessoal. O formulário para submissão é muito simples, e na época que submeti nem tinha nada preparado ainda, apenas uma ideia do que ia falar e quanto tempo levaria.

Acredito que o essencial seja ter algo que você queira compartilhar. Essa biblioteca foi muito útil para mim, e eu queria que outras pessoas conhecessem o trabalho dos criadores. Talvez elas também precisassem de algo mais rápido para parsear HTML. É muito comum que em algum ponto duvidemos da nossa ideia, pensemos se alguém achará interessante, se teremos capacidade de produzir algo legal. Mas é importante lembrar que seu papel é ter a ideia e submeter, quem vai avaliar é a coordenação da trilha. Claro que você vai criticar seu trabalho, mas a decisão sobre se ele deve fazer parte do TDC ou não está fora do seu controle. Inclusive, junto com essa, submeti outra que não foi aceita, sobre usar containers Docker no processo de exploração de dados.

Uma coisa que é interessante e acho que poucas pessoas sabem — eu não sabia, pelo menos — é que a submissão de trilhas também é livre. Ou seja, se você acha que tem um assunto que poderia ser uma trilha de palestras, é só mandar para avaliação.

No dia da palestra, eu cheguei no TDC bastante nervosa. Comecei a me questionar sobre pontos da talk e a ter a sensação de que tinha esquecido de algo importante. Minha apresentação, que era um HTML gerado a partir de um notebook Jupyter, não estava funcionando como no dia anterior, ao testar poucos minutos antes de subir no palco. Até agora não sei por quê. Mas salvei correndo uma nova versão, que, felizmente, funcionou normalmente.

Quando comecei a falar, ainda estava nervosa e acho que gagajei um pouco. Mas logo a sensação de ansiedade passou e foquei completamente no que eu queria transmitir, tentando lembrar que eu sabia o que estava falando, e por isso estava tudo bem. No fim dos 25 minutos eu estava me divertindo e contente de ver pessoas compenetradas.

No tempo disponível para perguntas da plateia, ninguém quis o microfone, e confesso que murchei um pouco. Mas, felizmente, depois que me sentei, um moço veio falar comigo. Queria saber se eu tinha tentando usar o Beautiful Soup antes da lxml. Obrigada, moço! Depois dessa experiência, em todas as palestras que ninguém mais fez perguntas, eu fiz pelo menos uma.

Fiquei para assistir todas as palestras que se seguiram e recomendo muito a todos checar as apresentações, quando forem disponibilizadas. Meus parabéns a todas as pessoas que palestraram e à coordenação.

Por que palestrar? Por que se dar ao trabalho de criar uma palestra, ensaiar, estudar, etc. e passar por todo o nervosismo?

Bom, para mim, apesar do nervosismo, é prazeroso. Eu gosto de compartilhar as coisas que sei com as pessoas, especialmente se é algo completamente novo para elas. Até explicar de novo e de novo de formas diferentes por que a pessoa não entendeu pode ser legal. Com certeza, sempre que tiver algo para compartilhar, vou submeter para o TDC e outros eventos. Mas se você não acha que vai ser uma atividade divertida e quer outras razões, aqui vão três:

  • Você ganha entrada grátis para uma trilha por dia do evento. Caso contrário, você teria que pagar por cada uma — caso não seja uma trilha grátis, como a Stadium. Eu tinha algo que queria ver todos os dias, então considero este um grande benefício.
source: Michael Longmire via Unsplash
  • Networking. Mais pessoas vão saber quem você é, de onde você vem e o que você sabe. Essas pessoas podem virar contatos e até amizades para trocar conhecimentos e saber o que está acontecendo na indústria. No dia do evento, várias pessoas me adicionaram no Linkedin, e algumas pessoas da comunidade Python que considero amigas, conheci ou revi durante as edições de que participei.
source: Samuel Zeller via Unsplash
  • Falar em público é uma habilidade útil. Mesmo que você não tenha interesse em palestrar em eventos, provavelmente terá que apresentar um conteúdo para um grupo de pessoas em algum momento, e essa parece ser uma habilidade que melhora com a experiência. Em geral, é difícil falar e se fazer compreender para várias pessoas quando não temos o hábito de fazê-lo.

Concluindo, é o tipo de coisa que tende a trazer mais ganho que perdas. Se você já considerou minimamente a ideia, vai lá, submete. Desejo-lhe sorte!

--

--