O ePub3 que o PNLD quer

José Fernando Tavares
Booknando
Published in
7 min readApr 13, 2017

Post publicado originalmente no blog Colofão

Minha primeira experiência autêntica com livros acessíveis aconteceu no início de 2012. Já tinha estudado sobre o assunto e até mesmo produzido livros que achava serem acessíveis, mas a compreensão pessoal me veio quando um amigo meu pediu que eu apresentasse os livros digitais para um estudante com problemas de visão. No mesmo instante pensei que o sistema de leitura em voz alta (TTS[1]) presente no iPad resolveria o problema deste estudante.

Realmente ele ficou muito feliz ao poder ouvir o texto narrado pela voz do aparelho. Porém, ao chegar ao ponto no livro onde o sistema de leitura pronunciava de modo claro e convicto “imagem dê esse cê zero zero um ponto jota pê jê”, e seguia imperturbado a sua leitura, o rapaz olhou pra mim e disse: “Não entendi.” “Nem eu”, respondi.

A partir desta experiência real de acessibilidade percebi o quão longe eu estava de oferecer um conteúdo “acessível”.

O PNLD 2018 (enquanto o PNLD 2019 não chega!) vem nos ajudar a pensar em como melhorar o conteúdo que oferecemos do ponto de vista da acessibilidade. Com este termo entendo não só conteúdo para pessoas com deficiências físicas, mas também aquela acessibilidade banal que me permite desfrutar do conteúdo sem ter que instalar mil softwares.

Os editores que trabalham com livro didáticos e que utilizam o PNLD para vender seus livros para o governo já sabem da possibilidade de enviar o seu conteúdo no formato ePub3, além do MecDaisy[2], que permanece sempre válido.

Muitas editoras que não tiveram a oportunidade de aprender o que é o ePub3 estão correndo atrás deste recurso[3], procurando entender do que efetivamente se trata.

Sobre o ePub e suas vantagens para livros de texto em geral (romance, ficção etc.) já não há mais dúvidas. Porém, muitas dúvidas permanecem quanto às vantagens dele para conteúdos educacionais, ou livros de texto mais complexos[4].

Quero me focar aqui no quesito acessibilidade, pois é este o contexto no qual o uso do ePub3 é apresentado pelo PNLD[5].

Vamos tentar entender um pouco mais o que o edital pede no que diz respeito à acessibilidade do livro digital:

No ponto 7.7.3.3 pede Suporte TTS (text-to-speech) para converter o conteúdo de texto em voz, com controle sobre a pronúncia e a prosódia, assim como a possibilidade de sincronizar o texto com a voz (Media Overlays);

Para que o TTS funcione de modo correto, precisamos ter um texto corretamente codificado de maneira coerente e “limpa”[6], de modo que o sistema consiga reconhecer o texto e a leitura lógica dele. É fundamental, portanto, o uso correto da semântica do HTML5, que permite e prevê o uso de tags pensadas também para o uso em sintetizadores vocais[7].

Outro ponto fundamental para que o TTS funcione é a declaração de língua. A tag xml:lang deveria estar presente no início da página, declarando a língua principal. No meio do texto deveria aparecer somente quando algum parágrafo é apresentado em outra língua[8]. Uma atenção especial também vai para a codificação das várias línguas; assim, por exemplo, o nosso português deveria ser xml:lang= “pt-br” e não simplesmente “pt” ou “br”.

Ainda sobre o TTS, o decreto pede algo a mais: controle sobre a pronúncia e a prosódia. Existe, sim, o recurso de controlar diretamente na codificação o modo como uma palavra será pronunciada pelos aparelhos, ou a entoação da pronúncia[9], mas não sei quantas pessoas usam efetivamente estes recursos ou têm conhecimento deles.

O Media Overlays é um recurso levemente diferente do TTS. Neste caso, a voz é gravada e depois sincronizada com o texto. Não é claro se o PNLD pede as duas coisas, mas é possível que ele simplesmente queira que o texto seja destacado enquanto é lido em voz alta pelo aparelho, recurso este que os softwares de leitura já aplicam automaticamente com o TTS.

No caso do uso de Media Overlays, será necessário ter áudio e um sistema que o sincronize com o texto[10].

No ponto 7.7.3.4 o decreto fala do uso das fontes OpenType e WOFF (Web Open Font Format).

As fontes WOFF são menos conhecidas, mas oferecem uma ótima qualidade quando o conteúdo precisa ser visualizado em mais de um aparelho. Obviamente a solução melhor é o uso de mais de um formato de fonte, assim, caso uma delas não funcione, o sistema utilizará a outra.[11]

No ponto 7.7.3.5 o decreto fala da necessidade de “Recursos de navegação universais e flexíveis, como navegação por tabela de conteúdos, bem como elementos adicionais de navegação em pontos específicos, tais como em figuras e em tabelas”.

Este é um quesito muito importante. Além do tradicional sumário, o ePub3 oferece a possibilidade de ter sumários “secundários” com o uso da tag nav>, criando, assim, listas de tabelas, imagens e outros recursos de navegação que desfrutem da marcação semântica também exigida pelo decreto no ponto 7.7.3.7.[12]. Estas listas e pontos de navegação devem ser criados com recursos específicos e acessíveis, disponíveis no HTML[13].

E no ponto 7.7.3.6 fala-se de “Recursos para descrição de qualquer elemento do documento, como tabelas ou imagens”.

Aqui retorno ao início deste artigo. A imagem do texto lida pelo sintetizador de voz do tablet do meu amigo estava sem uma descrição interna que permita ao software entender o que era aquela imagem.

Esta informação embutida é essencial para que o nosso livro digital possa se dizer “acessível”. Não é porém uma tarefa de quem produz os livros, mas sim do editor, que precisa passar esta informação para que ela possa ser embutida no código através de um atributo chamado “alt”.

Neste atributo, não deve estar a legenda da imagem, mas sim uma descrição desta, pois o objetivo é apresentar à pessoa com problemas de visão uma descrição da imagem.

Para quem trabalha com os produtos Adobe é muito simples editar a imagem no Photoshop já embutindo a respectiva descrição. Esta descrição pode ser acessada pelo InDesign e depois repassada de modo automático para o ePub

Estas descrições são também fundamentais em gráficos e tabelas, caso estes sejam apresentados como imagens.

Enfim, há muitos outros aspectos importantes da acessibilidade; estes acima servem apenas para estimular a discussão e o aprofundamento sobre o tema. Na minha opinião, o problema da produção de livros digitais acessíveis não está tanto em dificuldades técnicas relativas ao formato, mas sim no trabalho que o editor precisa fazer para pensar e preparar os elementos que deixamo seu conteúdo mais acessível.

Fundamental, portanto, é o planejamento destes conteúdos, já pensando no digital em vista de um formato que prevê o seu uso em vários dispositivos, portáteis ou não, e que precisam ser acessíveis também para quem não possui a visão como sentido privilegiado para a aprendizagem.

Notas

[1] Text-to-Speech. Para entender melhor: Síntese de voz — Wikipedia.

[2] O MecDaisy é uma variação criada pelo Ministério da Educação baseada no Daisy, um padrão para a codificação do texto com ênfase na acessibilidade.

[3] Uma oportunidade para atualizar-se na produção de livros digitais é o curso online “Técnicas de produção de livros digitais”.

[4] Vamos precisar de mais de um artigo para podermos entender melhor estas possibilidades, se são reais ou não, mas o foco aqui é outro.

[5] Ver ponto 7.1. Os alunos e professores com deficiência receberão as mesmas obras distribuídas às suas escolas em formato acessível, devendo optar pelo formato MecDaisy ou EPUB3.

[6] Quem já produziu um arquivo ePub sabe que alguns softwares, como o InDesign, podem produzir no código elementos desnecessários e que deixam a leitura deste muito confusa.

[7] Um exemplo significativo é a tag strong>, que corresponde do ponto de vista visual a um “bold”. Porém, do ponto de vista semântico, ela não está ligada necessariamente a um elemento visual, pois passa a ideia ao sintentizador vocal de “voz forte”. O mesmo vale para a tag em>, usada para a ênfase, que no texto escrito é representada pelo itálico.

[8] Infelizmente uma preparação ruim do conteúdo no InDesign pode fazer com que tags xml:lang apareçam perdidas no meio do texto sem necessidade.

[9] Este é um recurso mais sofisticado que faz uso de “Léxicos PLS”, de uma “linguagem de marcação para síntese vocal SSML” e de recursos especiais do CSS, como o “CSS Speech”.

[10] Neste caso se trata do SMIL, que está entre as especificações do ePub3. Existem softwares que fazem isto automaticamente.

[11] O Google Fonts oferece um bom recurso de fontes WOFF.

[12] 7.7.3.7. Marcação semântica para elementos de destaque como glossários, legendas, fontes, créditos, ícones de atividades específicas, boxes de destaque, e outros elementos estruturais;

[13] Fundamental é o uso das tags <ul> e <li> combinadas com o <nav>, que fazem estas listas serem reconhecidas como “sumários” pelos softwares de leitura.

--

--

José Fernando Tavares
Booknando

Founder of Booknando. Speaker, teacher, instructional Designer and e-book expert, gives e-book training class in Brazil and Italy. Philosophy lover.