Quem disse que o som é invisível?

Um olhar apaixonado sobre o assombroso uso do som e da linguagem na obra-prima M — O Vampiro de Dusseldorf

Fábio Luis Rockenbach
Cena a Cena
15 min readOct 7, 2021

--

Na caçada a um psicopata, montagem, som e enquadramento criam uma das primeiras obras-primas prontas para serem analisadas em todos os recursos que compõem a linguagem audiovisual: som, imagem e diálogos.

Qual a porcentagem do público médio frequentador de cinemas que, hoje, realmente repara no som de um filme?

Não me refiro aqui à qualidade dos efeitos sonoros, do som da sala, dos efeitos que invadem os canais e afins. Me refiro, na verdade, à percepção de como o som amplia nossa experiência e nos ajuda a efetivamente ver o filme à nossa frente.

Por que as pessoas, enfim, prestam tão pouca atenção ao som? A resposta pode gerar um outro texto a respeito, mas isso acontece, basicamente, porque estamos tão acostumados à tridimensionalidade sonora da nossa vida que, diferente dos bebês que estão descobrindo o mundo, não paramos para olhar para o lado ao notarmos cada ruído de carro, pássaro, máquina, televisão ou música que ouvimos quando caminhamos pela rua.

É a capacidade do cinema de recriar essa tridimensionalidade que ajuda a tornar a experiência de assistir a um filme um processo de imersão dentro de um universo diegético. Universo esse que, justamente por ser povoado por sons de todos os tipos, amplia a ideia de estarmos visualizando um mundo real.

Assim, por estar acostumado a ouvir sons ao seu redor e não necessariamente voltar-se para ver a origem de todos eles, o espectador, muitas vezes, deixa de perceber como certas escolhas sonoras são trabalhadas para ampliar nossa imersão e nos contar algo. Por sermos espectadores alfabetizados de forma avançada na linguagem audiovisual, deixamos de perceber nuances de como ela é usada.

Caixa? Mais do que isso: nos primeiros “talkies”, a câmera estava enclausurada em uma cabine à prova de som. Décadas de desenvolvimento da linguagem soterrados pelo som. Caberia a alguns mestres prosseguir no desenvolvimento do cinema após esse baque…

O processo para chegar até aqui, claro, foi árduo, e o surgimento do som, ao contrário do que muitos pensam, significou um enorme retrocesso em 1927. E isso porque, no tempo em que a Warner lançou O Cantor de Jazz, o cinema vinha de 30 anos de criação, consolidação e desenvolvimento de uma proposta de linguagem discursiva baseada apenas na imagem. Cineastas descobriram fórmulas de dizer o que precisavam sem a muleta sonora, usando cortes, movimentos, enquadramentos e, de repente, o som surge para engessar esse processo brevemente apoiado em dois obstáculos:

- a preguiça de expressar algo visualmente, já que agora era possível DIZER o que antes era preciso mostrar;

- as limitações técnicas a que a câmera estava sujeita, agora que ela precisava estar enclausurada em uma caixa — carinhosamente apelidada nos primeiros tempos de “ice box” — à prova de som e, também, praticamente imóvel. A câmera, que era móvel, encontrava um novo obstáculo: a limitação imposta pelos fios, microfones e a própria caixa.

Felizmente, não demorou muito para que alguns diretores descobrissem que, mais do que limitar, o som poderia expandir a experiência do cinema, indo, nesse sentido, de gênios como Hitchcock, com seu Chantagem e Confissão (1929), a um dos pioneiros mais geniais dessa arte, Rouben Mamoulian, que em Aplauso (também de 29) usou o som discursivamente. O volume soava alto quando, de certa forma, estávamos próximos — não apenas fisicamente, mas emocionalmente — dos personagens, e o silêncio imperava nos momentos em que o distanciamento frio era evocado na narrativa.

Em O Médico e o Monstro (1931), Mamoulian, ao usar a câmera subjetiva, já dava outro passo adiante: o volume do som representava o quão próximo fisicamente estavam os personagens do público, sendo a voz do personagem principal, na sequência inicial, muito mais alta e abafada do que as dos demais.

Nada disso é segredo: recomendo a leitura de Técnicas de Edição para Cinema e Vídeo — História, teoria e prática, obra essencial de Ken Dancyger. Apesar de relativamente caro, é um livro obrigatório e delicioso.

Nenhum desses artistas, no entanto, alcançou a genialidade discursiva de Fritz Lang, que mais ou menos na mesma época e contando com os mesmos recursos usou o som de forma tão brilhante em M — O Vampiro de Dusseldorf (1931) que o filme, ainda hoje, impõe-se não apenas como um clássico necessário, mas assombroso. É em torno do uso do som e da própria sofisticação narrativa em outros quesitos — montagem e mise-en-cène, sobretudo — que a coluna Close Up dedica, agora, seu olhar reverenciador a um dos marcos do cinema.

“Enquanto ouvimos, sabemos onde estão”

Não vou me ater aqui aos fatos que envolvem o filme de Lang — a mudança de nome, por exemplo, tendo sido sua escolha inicial “Um Assassino Entre Nós” — , uma vez que qualquer pesquisa sobre a obra trará à tona todas as histórias e curiosidades relacionadas ao projeto.

Prefiro começar com uma cena que é uma espécie de apresentação informal do diretor para o público da época; um diálogo expositivo direcionado a ajudar a educar um público pouco afeito a não apenas ouvir diálogos, mas outros sons em tela, ainda que Lang aqui trabalhe com poucos sons diegéticos e, em determinados momentos, não tenhamos um som sequer; espécie de anomalia para o público contemporâneo.

A história, qualquer cinéfilo conhece de cor:

Em Dusseldorf, na Alemanha, a população está apavorada. Crianças estão desaparecendo das ruas e um misterioso assassino, que recebe simplesmente a alcunha de “M” — letra inicial de “assassino” em alemão — envia cartas aos jornais reivindicando a autoria dos sequestros e assassinatos. A cidade, assustada, convive com o medo e todos passam a desconfiar de todos — um plot maravilhoso para mostrar a paranóia inquisidora em uma das cenas do filme. Pressionada, a polícia promove uma verdadeira caçada ao assassino misterioso, povoando as ruas de oficiais, contando com a vigilância da própria população. Essas medidas são terríveis para os bandidos da cidade, que consequentemente vêem suas atividades serem atrapalhadas pelo aumento da vigilância. Paralelamente, sem que travem qualquer tipo de acordo, policiais e bandidos decidem procurar pelo assassino para que a situação volte ao normal. São os bandidos que primeiro encontram Hans Beckert, um homem perturbado por sua atração assassina por crianças, quase uma segunda personalidade incontrolável. Preso, ele é levado para os esgotos e julgado pelos próprios bandidos.

“Enquanto ouvimos elas cantarem, sabemos onde estão.’ A frase profética no início também simboliza as descobertas de Lang: o som funciona como elemento que oferece tridimensionalidade ao filme e substitui a visualização de algo, que pode ser apreendido ou imaginado pelo espectador.

É possível resumir parte da lógica pensada pelo diretor a partir de uma única frase dita no início do filme, aparentemente inserida no roteiro para ajudar o público da época a entender o que irá acontecer.

A mãe da primeira vítima, Elsie, conversa com uma vizinha, que diz reclamar da música cantada pelas crianças no lado de fora dos apartamentos, que fala justamente do psicopata que assombra a cidade. A mãe de Elsie, então, d

“Enquanto ouvimos, sabemos onde elas estão.”

Isso, diretamente, é Lang ensinando o público em 1931 a associar o som, de forma narrativa, aos personagens, mais do que à simples representação tridimensional do meio. Fabuloso mesmo é como, em meio ao deslumbre pelo uso do som, ele já percebia que o conhecido silêncio pode, muitas vezes, ser mais importante para a narrativa do que o som: é assim que o silêncio pode inclusive tornar-se (quase) visível.

É o que acontece quando a mãe de Elsie, assustada com o atraso de mais de uma hora de sua volta da escola, grita e chama pela filha. Não ouve nada, recebe apenas o silêncio. À medida que seus gritos vão ficando mais fracos, indicando o quanto nos distanciamos da personagem, alternam-se imagens de lugares que a menina costumava frequentar, mas sem sua presença. O silêncio e o vazio substituem, narrativamente, a ideia de que a menina se foi.

Para completar, o balão que ela ganha de presente do assassino é mostrado flutuando, mas com um sentido ainda mais amplo: em vez de mostrá-lo simplesmente voando para longe, Lang o mostra enganchado em fios de alta tensão. Simbolismo claro da violência que foi cometida contra ela.

Se assovio funciona como leitmotiv, substituindo a presença do personagem, o silêncio e a ausência substituem mentalmente a presença da menina desaparecida.

É, portanto, assustadora a maturidade com que Lang usa, para contar essa história fascinante e os paralelismos que ela permite, todos os recursos de que dispõe em um tempo em que grande parte dos diretores ainda pensava no som apenas como uma representação da realidade.

O filme todo é uma sucessão de exemplos à medida que se desenvolve. Dez anos antes de Cidadão Kane usar o recurso, o som nos engana durante um transição, servindo como ponte sonora. Vemos uma multidão lendo um cartaz com notícias sobre o mais recente desaparecimento, mas não conseguimos ler o que está escrito. Todos de costas e, então, um dos personagens pede que quem está mais à frente leia para todos. Começamos a ouvir uma voz, que aparentemente é a de alguém na multidão e…

Uso do som na montagem precedendo Cidadão Kane: um membro da multidão pede a quem está na frente que leia o cartaz. Começamos a ouvir uma voz lendo o texto e achamos que é alguém da multidão, mas logo percebemos que é a voz de um homem num grupo reunido numa mesa, longe dali.

…sem interromper o som, cortamos para uma sala onde um senhor de idade prossegue a narração. Não era ninguém da multidão: ela foi usada apenas para exemplificar como, através do som, podemos criar pontes entre cenas de semelhante teor.

Welles usará muito isso em seu filme de estreia. Há, em M…, outros exemplos de como essa técnica é utilizada para agilizar o ritmo do filme, ligando cenas em locais diferentes. Antes da cena acima, por exemplo, quando chega o meio-dia, a mãe de Elsie ouve o badalar do relógio e olha para ele. Cortamos para a porta da escola e o que ouvimos, aí, é a sineta do colégio anunciando o fim da aula. O som do relógio e da sineta se mesclam, estabelecendo a relação entre as duas cenas e agilizando o ritmo.

Ponte sonora, de novo: o barulho do relógio na casa de Ilse se mistura com o som da sineta da escola no plano seguinte.

Em outro momento, a ponte sonora conecta duas cenas relacionadas que antevêem o plot que resultará no reconhecimento do assassino: o vendedor de balões testa o som do carrinho que levará para as ruas, e é o som do carrinho que faz a transição para a cena seguinte, já na rua, que mostra em plongée quase zenital as crianças em torno do já citado carrinho, uma construção visual que remete justamente à cena inicial, potencializando a importância desse personagem: é ele, afinal, que será responsável pela prisão do assassino.

Ponte sonora: o carrinho de venda de balões testado tem seu som seguindo de uma cena para outra, unindo-as.

Lang pensa o som como discurso e como parte de um todo. Em M…, aliás, talvez tenhamos a primeira representação clara do uso de um leitmotiv no cinema.

O leitmotiv, derivado da ópera, particularmente das composições de Wagner, é um tema normalmente de fácil assimilação que está associado, sempre, a um personagem, tema ou acontecimento da trama, e permite uma visualização a partir da identificação sonora.

Quando um leitmotiv ele se torna indissociável daquilo que representa, pode substituir a própria imagem — vide o exemplo de Tubarão (1975)

A maturidade que eu menciono acima, no entanto, não está apenas no fato de que o personagem avisa o espectador da sua presença, ao assoviar “Na gruta do rei da montanha”, composta por Grieg, para Peer Gynt. A música é utilizada para representar fisicamente as intenções e o próprio ato do psicopata.

Por exemplo, na cena em que Hans transtorna-se ao ver uma menina na vitrine e mostra ao espectador toda a sua psicopatia, o assovio claramente demonstra a transformação do personagem, como se emergisse de dentro dele uma segunda persona sádica. Nas cenas seguintes, não vemos Hans, apenas a menina andando na rua, mas sabemos que o psicopata está cada vez mais próximo porque a melodia começa a ser assoviada cada vez mais rápida até que… surge a mãe em cena e a música, então, para de forma abrupta.

O som, unicamente, nos permite entender que o personagem parou, afastado pela presença da mãe, e, mais do que isso, que o psicopata cedeu lugar ao aparentemente inofensivo Hans.

Ele surge, logo a seguir, parado em frente a uma vitrine, disfarçando suas intenções, repelido pela presença materna. A cena marca, também, como é através da música que o assassino será reconhecido, ironicamente, pelo cego vendedor de balões.

O som substituindo um personagem, como Spielberg faria com Tubarão em 1975: na segunda imagem, a velocidade do assovio parece aumentar à medida que vemos a menina se mover, e só para quando repentinamente a mãe da menina aparece. Não há trilha sonora no filme, e mesmo com pouco uso dos foleys, o uso do som é feito de forma extremamente narrativa, um marco do cinema.

Aliás, podemos voltar um pouco na mesma cena, aproveitando o ensejo, para mostrar como Lang amplia sua genialidade para além do uso do som.

Quando enxerga a jovem, Hans o faz através de uma vitrine, e ele vê a criança pelo reflexo do vidro. Lang, então, mostra a menina refletida no meio de um conjunto de facas, diretamente apontando o arriscado destino que pode se aproximar da criança.

Quando ela sai, a mesma vitrine é usada para demonstrar a segunda personalidade doentia e incontrolável do psicopata, uma vez que, ao se virar assoviando para persegui-la, vemos dois Hans em cena: um deles em frente ao vidro, o outro refletido. Essa duplicidade na personalidade já era explicada, antes, com outro exemplo da maturidade de Lang — que posteriormente se tornaria lugar comum no cinema: um grafologista analisa a letra dos bilhetes e reconstrói a personalidade do criminoso. No momento em que ele começa a falar sobre a provável personalidade insana, a montagem nos coloca Hans em frente ao espelho, em uma expressão que personifica a ideia de insanidade.

Brilhante sequência em que Hans vê uma provável vítima emoldurada por um jogo de facas na vitrine de uma loja. Ao segui-la e começar a assoviar, o espelho sugere o surgimento de uma segunda personalidade. O espelho já havia sido usado na primeira vez que vemos Hans Beckert, enquanto ouvimos em off o chefe de polícia explicar a análise da letra do bilhete sugerindo que o assassino apresentava traços de insanidade.

O apuro visual de Lang mantém uma construção de lógica constante ao longo da narrativa, principalmente a partir do momento em que o cerco começa a se fechar sobre o assassino. Repare que, desde então, em inúmeros momentos, nós o vemos enclausurado por elementos cenográficos — folhas de um arbusto ou grades dentro do depósito em que ele é capturado — ou mesmo pela forma como ele é enquadrado junto a esse cenário, em que a simples posição da câmera o pressiona de costas contra um dos lados do quadro.

Hans Beckert, o assassino, mostrado enclausurado, pressionado, sufocado.
Sem palavras, Lang nos explica que os homens que vemos são bandidos. Depois de um deles conferir as horas, tira um relógio para ajeitar. O gesto é corriqueiro, mas logo ele tira, 2,3,4,… 7 relógios, enquanto ao lado dele senta-se outro que faz truques com cartas. São ladrões e trambiqueiros. E ninguém precisa DIZER isso no roteiro, a imagem fala sozinha. O cinema mudo aprendeu a dizer muito sem som. Quando o som surge, nos primeiros filmes, faz regredir anos de evolução na linguagem visual pelas limitações da câmera, do processo e pela preguiça de colocar em palavras o que antes era mostrado. É preciso que diretores como Rouben Mamoulian, Hitchcock e Lang explorem o som como elemento da narrativa — e não muleta — e continuem desenvolvendo a ideia de que um filme deve poder se expressar pelas imagens sem o som, se esse não for possível ou necessário

Já que falamos sobre o discurso visual, abordemos, então, a maturidade que já havia sido adquirida quanto à forma com que a câmera pode nos contar algo sem diálogos. E isso para mostrar que Lang não está obcecado com o uso do som, mas ciente de que é preciso haver um meio termo na forma como os elementos da linguagem se articulam.

Na apresentação dos personagens criminosos, por exemplo, nada indica que os homens que vemos conversando em uma sala elegante e que encontram-se muito bem vestidos são bandidos.

Assim como fazia outro mestre que pregava que a imagem deve poder falar sozinha — e me refiro a Hitchcock — , Fritz Lang nos conta quem são aqueles homens sem diálogo algum. Após consultar as horas, um deles tira do bolso um relógio e o sincroniza. Então, tira outro, e outro, e outro… e outro. E ao seu lado, senta-se outro colega que começa a fazer truques com cartas. Não demora para percebermos que estamos diante de ladrões e trapaceiros, introduzindo, sem palavras, aquele núcleo que se tornará tão importante na trama.

Por ambientar-se em dois núcleos distintos e numa trama simples — dois grupos diferentes caçando um mesmo psicopata — , Lang tem a possibilidade de continuamente discursar através do som e da imagem, ou apenas através de um desses elementos, acerca desses pólos essenciais.

É magistral, por exemplo, o plano-sequência em que o diretor transita do ambiente em que, do sindicato dos mendigos, nos movemos através de diferentes locais até chegarmos ao sindicato dos bandidos. Sim, é provável que os “sindicatos” também sejam uma crítica ácida de Lang. Não é por acaso, também, que quando nos aproximamos do cômodo onde os bandidos, em fila indiana, recebem a área da cidade que deverão vigiar na busca pelo psicopata, nós os vejamos inicialmente através das grades de uma janela.

E aí, também antes de Kane e sua incensada passagem da câmera através do teto, temos a câmera atravessando o vidro em um movimento contínuo, depois de uma extensa movimentação com diferença de nível, inclusive.

Lembre-se: estamos em 1931.

Brilhante plano-sequência que se encerra no sindicato dos ladrões: antes de Kane, Lang já fazia uma câmera atravessar uma janela num movimento contínuo que começa 4 ambientes antes, e de forma mais natural do que na obra-prima de Welles.

Vamos além, para atestarmos como o diretor, que anos depois superaria a desconfiança com que a América lhe recebeu, entregando-lhe o controle de produções B em gêneros populares como o western e o noir, demonstra um repertório vasto de ferramentas para trabalhar visualmente.

Da câmera tremida, indicando a adrenalina e a urgência da sequência em que Hans foge pelas ruas, desesperado, passando pelo belo trabalho de câmera em que a simples panorâmica amplia o quadro para que o espectador veja aquilo que nem Hans via — como quando ele é visto na rua e percebe que foi reconhecido — até o dolly out em ângulo zenital do momento em que um dos bandidos, deixados para trás, é auxiliado a sair do buraco que cavou apenas para, na continuidade do movimento, percebermos que quem o ajudava a sair não eram os seus colegas, e sim a polícia: é assim que Lang demonstrava já naquela época possuir mais repertório do que grande parte dos diretores de hoje, que cresceram numa era audiovisual específica e não conseguiram aprender a usar tantos recursos de forma controlada e narrativa.

Trabalho de câmera, herança dos aprendizados do cinema mudo. A impressão de câmera na mão, a câmera que se move e revela o que antes não víamos e a câmera que sobe na vertical desde o buraco no chão e nos surpreende, revelando o que não víamos antes do movimento.

Mas se o discurso visual é muito bem planejado, nada supera a riqueza do uso do som e da forma como ele agiliza o ritmo do filme, conduz a montagem e funciona narrativamente, como já mencionamos.

Uma das grandes funções do som, que é o de oferecer tri-dimensionalidade ao quadro plano e estender o mundo do filme para além do que vemos, por exemplo, já é usado por Lang em cenas em que apenas ouvimos diálogos ou ações, e os personagens à nossa frente olham PARA FORA DO QUADRO. O espectador complementa o que está acontecendo, e o faz apenas através daquilo que OUVE.

Nas imagens 1 e 2, o uso do fora de campo: os personagens olham para algo que não vemos e o som substitui a visualização. Lang começa a a estabelecer usos inteligentes para o som. Na terceira imagem, o uso do som permite que ele trabalhe um diálogo apenas com sombras, numa cena que não funcionaria sem som.

Mas a essa altura, qualquer cinéfilo, mesmo os que nunca viram o filme, já ouviram falar da consagrada montagem paralela empregada pelo diretor e pelo montador Paul Falkenberg — um nome que é normalmente esquecido quando se fala do filme, talvez pelos poucos trabalhos da carreira, o que pode indicar a participação ativa de Lang, em termos intelectuais, na montagem do filme.

Na cena, temos os dois blocos narrativos — antagônicos em sua essência, mas ligados pelo mesmo objetivo — em reuniões destinadas a decidir o que fazer para capturar o psicopata; os policiais, por seu objetivo profissional, e os ladrões, para terem novamente as ruas “limpas” para “trabalhar”.

O que acontece a partir disso é genial e influenciou muitos filmes e diretores nos 110 anos seguintes.

Temos, inicialmente, um paralelo pela mise-en-scène: roupas, disposição, ambiente e elementos cenográficos indicam similaridades entre os dois grupos, complementada pela presença da fumaça dos charutos e cigarros. Se a organização de atores e elementos de cena preparam esse paralelo, é a montagem que o faz funcionar de forma dinâmica, quando temos gestos iniciados em uma cena encerrados por um raccord perfeito nas mãos de outro personagem, no outro ambiente. Sonoramente, temos frases iniciadas em um ambiente complementadas em outro. Aqui, a fluidez é total.

Não apenas a montagem encerra esse elemento comparativo, mas em certos momentos, também, a mise-en-scène é preparada para fazer com que os cortes de um ambiente a outro nos passem a impressão de que os personagens estão conversando uns com os outros, como mostra a imagem abaixo:
Trabalho visual complementa o som nas reuniões paralelas de policiais e bandidos. Em certo momento, a orientação de quem fala é feita de forma a dar a impressão de que estão falando um com o outro.

O que Lang estabelece aqui é um grande exemplo da diferença entre a montagem alternada e a montagem paralela, conforme discutimos já em um artigo anterior. As duas cenas poderiam estar se passando em momentos diferentes, mas a alternância entre eles nos leva a supor que, ao mesmo tempo em que policiais discutiam a situação, os bandidos fazem o mesmo em outro local da cidade.

Isso indica a montagem como sendo alternada — ações simultâneas com relações entre elas — , mas ela é, sobretudo, uma montagem paralela, uma vez que a relação entre as cenas não é de mera simultaneidade, mas também de construção de sentido simbólico ou metafórico.

A grande ironia: quem encontra o assassino, mesmo com milhares de olhos procurando nas ruas, é um cego. Graças ao… SOM, do assovio.

Como comentei no início, não vou me ater aqui a discutir outros aspectos que tornam o filme tão rico — a contextualização do momento vivido pela Alemanha; a crítica ácida na forma como estabelece paralelos entre bandidos e policiais; o olhar mordaz sobre a ânsia punitiva da população e a forma como o medo pode fazer a população ser direcionada a comportamentos questionáveis; sem falar, obviamente, sobre todo o contexto que envolve um psicopata ser julgado pelos bandidos na maravilhosa cena final nos esgotos.

Se Lang, aliás, não abre espaço para uma decisão mais ousada nessa sequência, interrompendo-a com o surgimento da lei — e da ordem, portanto — , não perde a chance de também deixar um questionamento final quando, sem nos mostrar o resultado do julgamento, coloca na boca de uma personagem a frase:

“Alguém precisa cuidar melhor das nossas crianças.”

São momentos como esse que levaram o filme a ser considerado profético — uma afirmação fácil de ser feita hoje e que poderia ser aplicada a várias obras do período. Mais do que uma profecia, no entanto, coloco o filme como um reflexo dos sombrios anos pós-primeira guerra e da incerteza que se abateu sobre a sociedade alemã, característica marcante do expressionismo alemão, inclusive.

Mas o que não muda de forma alguma é o fato de que, mais de 80 anos depois, o filme continua um assombroso exemplo de um diretor muito à frente do seu tempo.

--

--

Fábio Luis Rockenbach
Cena a Cena

Jornalista, crítico e especialista em cinema e linguagem audiovisual. Professor dos cursos de Jornalismo, Artes e Publicidade da UPF-RS