Alexa, voltamos à era do áudio?

Published in

#EmpiricusTech

10 min readFeb 24, 2021

A evolução do nosso conteúdo

A Empiricus abriu suas portas entregando relatórios de recomendações de investimentos por e-mail. Sem levar em conta o conteúdo, não era nada muito sofisticado: um texto alinhado, formatado, exportado em PDF e enviado para corretoras. Simples e eficaz.

Quando entrei na empresa, 6 anos após o seu início, o modelo ainda era praticamente o mesmo. A diferença estava somente na democratização promovida ao disponibilizar as análises e recomendações financeiras diretamente para as pessoas físicas sem o intermédio dos agentes autônomos.

Publicação PDF de 2014

Hoje chamamos de “publicação” aquilo que um dia chamamos de “relatório”, mas tudo sempre girou em torno de grandes textos. Nossa Área de Assinantes era gerenciada por uma empresa terceirizada e não passava de um repositório (quase uma pasta “Meus Documentos” do Windows) com alguns vídeos e infinitos relatórios criados diariamente pela nossa equipe de análise.

Dois andares abaixo de onde ficavam os analistas, nossa equipe de TI frequentemente batia a testa no drywall tentando encontrar formas de melhorar a experiência dos nossos assinantes, tarefa quase impossível visto que não tínhamos nenhum controle do principal sistema da empresa.

Imagem mostra a antiga área de assinantes da Empiricus com o menu lateral vermelho conforme a cor da marca e no centro a listagem de publicações da série Palavra do Estrategista. — *Área de Assinantes em 2016*

Em 2017 obtivemos uma das nossas maiores conquistas: assumimos internamente a Área de Assinantes. Nossos conteúdos de texto passaram a ser em HTML, e com isso um gigantesco leque de possibilidades entrou pelas portas da empresa:

O conteúdo passou a se adaptar automaticamente ao tamanho de tela do dispositivo do usuário.
Desenvolvemos a possibilidade de ajustar o tamanho da fonte dos textos para se adequar à necessidade de todos os leitores.
As séries ganharam tabelas personalizadas com cotações de ativos atualizadas em tempo real.
Conteúdo interativo agora podia ser adicionado no cerne da análise, e até GIF de gatinho poderia ser inserido caso fosse a vontade do analista.

Imagem mostra um gato lambendo a água corrente da torneira. — GIF de gatinho inserido pelo Analista

Quando viramos o sistema nós anunciamos para os nossos leitores mais engajados, e com aquele “nervosismo de estreia” grudamos os olhos no Google Analytics até ver o número de acessos subir gradativamente.

Google Analytics mostrando 666 usuários online — Google Analytics

Muita merda na porta do teatro e o próprio nervosismo de estreia foi dando lugar à sensação de dever cumprido. Finalmente tínhamos um produto de tecnologia que realmente agregava valor para o nosso assinante, fazendo-o sair do conforto da sua caixa de entrada para consumir o conteúdo diretamente na nossa plataforma.

Pouco tempo depois, acompanhando as tendências de acesso à informação do mercado, surgiu nosso app para Android e iOS. A primeira versão era um simples Webview e toda a transformação que fizemos na Área de Assinantes facilitou para que a recém criada equipe de Mobile pudesse lançar um aplicativo em tempo recorde.

As pessoas agora liam nossas publicações extensas de forma confortável na palma da mão. A equipe colocou tanto esforço e dedicação que o nosso aplicativo se tornou um Super App, e está caminhando para ser o melhor do segmento no Brasil.

Novo app da Empiricus com vídeos e cotações em tempo real.

A Área de Assinantes também recebeu constantes evoluções desde a virada de 2017, sempre seguindo a política de testar, errar e repetir, buscando o feedback daqueles que pagam as nossas contas. Inserimos diversos outros mecanismos de engajamento que atraiu o público para dentro, como nunca antes na história da empresa.

Em certo momento nós deixamos de ser apenas um sistema de conteúdos e passamos também a dar lucro. Aí chegou a explosão dos podcasts e percebemos um movimento indicando o aumento do consumo de outro formato de conteúdo: o áudio.

Nos anos dourados do rádio as pessoas se sentavam ao redor do aparelho para ouvir a programação que variava entre notícias, canções e radionovelas, aliando a proximidade causada pela personificação do interlocutor por meio da sua voz, ao imediatismo em que as informações chegavam, ao contrário do jornal.

Já a nossa geração, quase sempre ocupada e consequentemente sem tempo, usa o modelo de áudio para poder se nutrir de conteúdo enquanto desempenha outras tarefas, como treinar, cozinhar ou dirigir. Nós também nos adequamos a isso e nosso time de Audiovisual grava, edita e formata os melhores podcasts do mercado financeiro. Mas isso ainda parecia não ser o suficiente.

Muitas pessoas persistem em cultivar o hábito da leitura e não abrem mão da versão escrita das nossas publicações. Mesmo com um público de áudio assíduo, é impossível transformar todo conteúdo da Empiricus em podcast.

Com esse “problema” em mente e levando em conta também a importância da acessibilidade nos dias atuais, inserimos uma funcionalidade onde os assinantes podem escutar todos os textos publicados. Quem quer, lê, quem não quer, escuta. Feedback Wins.

Botão “Ouvir texto” presente nas publicações — Botão "Ouvir texto" presente nas publicações

Mas a vontade de entregar soluções que realmente facilitam a vida do nosso leitor nos deixava inquietos. Em janeiro de 2020 mais de trinta mil publicações foram ouvidas na nossa Área de Assinantes/App usando o botão de Ouvir texto. Ainda assim, não era o cenário ideal que uma pessoa fosse obrigada a abrir o app ou o nosso site web, entrar na publicação, achar o botão e só então conseguir ouvir o texto.

Imagine que você receba uma notificação informando que uma nova publicação está disponível, porém está dirigindo ou com as mãos sujas cozinhando algo. Sem falar em pessoas com deficiência visual. Simplesmente não é prático.

“Alexa, abrir Empiricus”

Durante o último Prime Day resolvi adquirir alguns dispositivos Echo da Amazon, ou mais conhecidos simplesmente como Alexa (erroneamente, pois Alexa é o nome apenas da assistente virtual). Explorei a loja de Skills — como são chamados os apps desenvolvidos para Alexa — e notei que há uma variedade ainda bastante pobre disponível para nós tupiniquins.

Instalei um Echo Show (Alexa com tela) na minha cozinha e baixei uma Skill de receitas para testar a funcionalidade. Sem precisar tocar na tela eu vi os ingredientes, as quantidades, o passo-a-passo, o tempo de preparo, tudo com comandos feitos pela minha voz. Rita Lobo ficaria orgulhosa. “Sensacional!”, pensei, “Devíamos ter isso na Empiricus, não?”

Conversei com meu head Bruno Monteiro sobre a ideia de desenvolvermos uma Skill e levar para os assinantes um novo meio de consumir o nosso conteúdo sem precisar tirar o celular do bolso, nem ligar o computador, em suma, sem precisar tocar em nada. Ele me respondeu que haviam começado algo durante as minhas férias, mas por algum motivo não tinha ido pra frente. Como diz Felipe Miranda e a sua verdade inconveniente: se você se acha original, você apenas não leu o suficiente, risos.

Mesmo assim, com o aval do Board, decidimos lançar uma versão beta para testar o engajamento. Em aproximadamente um mês a skill estava disponível para ativação de forma gratuita para qualquer pessoa com um dispositivo Echo. Como parte desse primeiro lançamento, todo o conteúdo gratuito — newsletters, vídeos e podcasts — está disponível para ser consumido por quem tem uma Alexa. Basta ativar a skill, dizer “Alexa, abrir Empiricus” e ela te guiará na sua experiência.

Imagem mostra um Echo Show 8 branco com a tela inicial da skill da Empiricus aberta na tela. — *Skill da Empiricus no Echo Show*

O engajamento e a aceitação foram imediatos. Já temos pessoas pedindo para que os conteúdos pagos também sejam disponibilizados na Skill, e assim possam consumir tudo por lá. As avaliações foram muito positivas e estamos anotando os feedbacks, como de praxe, para melhorar a forma que entregamos o conteúdo para o nosso assinante.

DIY and Little bites of nerdy stuff

Para desenvolver a sua própria skill para Alexa é bem simples. Basta ter uma conta de desenvolvedor na Amazon, e você pode criar a sua aqui.

A documentação está totalmente em inglês, mas é bastante completa. A AWS (Amazon Web Services) oferece um console bastante intuitivo onde a criação de uma Skill pode ser feita até por quem nunca viu uma linha de código, basta escolher um nome, a linguagem disponível e escolher o modelo de Skill.

Os modelos são:

Custom: crie do zero sua skill, completamente em branco;
Flash Briefing: quando solicitado a skill reproduz as últimas atualizações ou notícias sobre um determinado assunto ou determinado portal (G1 e CNN já têm skills de briefing);
Smart Home: integração da Alexa com seu sistema de automação residencial. (Home Assistant, por exemplo);
Video: transformação da sua Alexa num player de vídeo.

Após essa etapa você deve escolher onde a sua Skill será hospedada. Ela roda em Lambda ( meu amigo Erick já escreveu um artigo bem legal falando um pouco como a tecnologia serverless funciona) e a Amazon oferece as opções para que seu código seja hospedado automaticamente — somente para Node e Python — ou que você suba sua infra por conta própria.

Caso você escolha hospedar automaticamente, a AWS oferece o chamado Free Tier. De acordo com cálculos independentes, o primeiro milhão de execuções é gratuito, então se a sua vontade é apenas experimentar, crie sua skill hospedada automaticamente e seja feliz. Outro ponto positivo de hospedar diretamente no console da AWS é o fato de ter um editor de código built-in, ou seja, nada de deploy. Tudo é atualizado automaticamente.

Como aqui na Empiricus já temos um background forte com Lambda e uma conta corporativa na AWS, decidimos subir a nossa própria infra. Para isso a Amazon disponibiliza um SDK para desenvolvimento local e posterior deploy na sua infraestrutura.

A única coisa que precisa necessariamente ser feita no console do desenvolvedor é a série de configurações da Skill. Dentre elas, você precisa definir as Intenções e as Falas, chamadas de Intents e Utterances, respectivamente. Intents são declaradas no código da sua Skill e contém um conjunto de entradas de modelos de fala, Utterances, para que a Alexa seja treinada e responda adequadamente ao pedido do usuário.

Na imagem/exemplo acima, a GetLastContentIntent será chamada quando o usuário pedir, por exemplo, pela Uterrance “qual o último conteúdo do Day One?”. Em seguida, a skill vai verificar se a GetLastContentIntent foi definida no código e executá-lo. Simples assim. Caso você seja mais old school, você pode definir todas as Intents e suas Utterances em um arquivo json e subir direto no console do desenvolvedor.

A SDK já disponibiliza várias bibliotecas que te auxiliam na execução de áudios e vídeos, leitura de textos, etc, então o grosso do trabalho é aplicar a sua regra de negócio à Skill. É possível adicionar todo tipo de personalização, como chamar o usuário pelo nome, identificar quem está interagindo quando mais de uma pessoa utiliza o mesmo dispositivo, salvar o progresso do usuário para que ele possa retomar o conteúdo de onde parou, conectar a conta pessoal da Amazon com o seu sistema, entre outras.

O cardápio já é bastante completo e a Amazon está constantemente adicionando recursos. Alguns deles ainda não estão disponíveis no Brasil, como pagamentos e alterar o humor da voz da Alexa. Provavelmente o impeditivo é a tradução para o Português. Chegaremos lá em breve, I hope.

Após o término do desenvolvimento, você deve convidar alguns usuários para uma rodada de testes e preencher um formulário para submeter a sua skill para aprovação da Amazon. Está disponível na documentação todo o roteiro de testes que eles seguem para a aceitação.

Siga a documentação à risca, pois sua skill não será aprovada se não atender a todos os critérios. Mas fique tranquilo(a), pois em caso de rejeição eles te enviam um relatório com todos os problemas encontrados para que você possa corrigir antes de refazer a submissão.

O prazo de resposta é de 12 dias, então tente fazer todos os testes possíveis. Assim que aprovada, sua skill é automaticamente disponibilizada para todos os países que você escolher no formulário de submissão.

Outro ponto importante é que a linguagem da Skill deve ser a mesma que a falada no país escolhido. Caso contrário você é obrigado a redigir um disclaimer na língua local informando aos seus usuários que termos estrangeiros estão presentes. Para usar nomes que contenham marcas registradas você deve comprovar que tem o registro dela.

Em casos de conexão da conta Amazon do usuário com a conta do seu sistema, você é obrigado a disponibilizar um link com os Termos de Uso. Um pouco burocrático, mas em tempos de abundantes fraudes na internet é bom ver que eles se preocupam com isso.

Na nossa Skill estão disponíveis todas as nossas newsletters que serão lidas com a voz da Alexa, podcasts que serão tocados pelo player do dispositivo assim como os vídeos. Caso o seu dispositivo Echo não tenha uma tela, o áudio do vídeo tocará normalmente. É importante você se preocupar que todo dispositivo consiga reproduzir todos os tipos de conteúdo, afinal, você deve se adequar à melhor forma de entregar para o seu usuário, e não o contrário.

De forma resumida, usamos Lambda — conectada ao Alexa Skills Kit — para executar o código e DynamoDB para gravar o progresso de usuários e disponibilizar o conteúdo para a Alexa consultar. Uma infraestrutura simples mas bastante eficiente. Os custos fecham em torno de U$4~5 a cada milhão de interações. Bastante justo.

Com preços tão acessíveis, facilidade de desenvolvimento e abundância de documentação, não há mais desculpas para o seu conteúdo ficar somente no texto. Promova a acessibilidade e coloque o seu conteúdo a um pedido de distância.

Alexa, voltamos à era do áudio?

Written by Leandro Sarmento