Percepção subjetiva em fones de ouvido

Linguagem e subjetividade no entendimento dos fones de ouvido.

CogniExper
9 min readOct 12, 2022
Photo by Blaz Erzetic on Unsplash

Todos os conceitos subjetivos utilizados na área da audiofilia são conceitos relacionais, uma vez que há sempre uma relação entre as frequências devido ao fenômeno conhecido como “mascaramento auditivo”, o qual faz parte da nossa percepção auditiva de volume. Ao ouvirmos um som isolado, nossa percepção é uma, mas ao ouvirmos uma música completa (mesmo uma música muito simples, como apenas um violão), a nossa percepção é outra, já que existe o mascaramento auditivo ou mascaramento entre as frequências, o que afeta a nossa percepção da resposta de frequência e da THD.

A fim de obter uma média das percepções sobre um conceito subjetivo específico utilizado pelos audiófilos, é possível cruzar três fontes de informação: análises encontradas na internet, escutas pessoais com fones de ouvido e gráficos de resposta de frequência. Observe-se que essa compreensão ainda não é científica, mas é um bom ponto de partida para se entender esses conceitos.

Quanto ao detalhamento, ele geralmente se refere a uma região acima de 10KHz, embora existam outras regiões na música que possam ser consideradas importantes. Alguns fones de ouvido apresentam bom desempenho em outras regiões, mas não possuem uma boa quantidade de volume acima de 10KHz. Por outro lado, existem fones simples com muito volume acima de 10KHz. Sabendo disso, podemos pensar sobre o próximo ponto.

Exemplos de fones considerados mais detalhados — Harman IE 2019 v2 Target, A12t, Annihilator 2021 S2 — IEF Graph Tool (crinacle.com)

Algumas pessoas confundem detalhamento com conceitos como resolução, definição e “incisividade nas notas” (esse conceito é relativamente novo e tem sido usado por pessoas que fazem análises de fones de ouvido). É verdade que o detalhamento pode se relacionar com as regiões de médio-graves, agudos, médios e agudos acima de 10KHz, mas é na região acima de 10KHz que a correlação com o detalhamento é mais forte. Outras regiões da resposta de frequência tendem a ter mais definição quando possuem um volume corretamente equilibrado em relação às demais regiões, nesse caso, passamos do conceito de detalhamento para o conceito de resolução e definição.

A resolução e a definição referem-se à resposta de frequência equilibrada. É compreendido que essa ideia de uma resposta de frequência perfeitamente equilibrada é quase utópica, já que a resposta de frequência depende do sistema auditivo individual. No entanto, a resolução e a definição tratam-se justamente desse conceito de equilíbrio perfeito na resposta de frequência de um fone de ouvido. É importante lembrar que, no âmbito do áudio, a compreensão deve ser relacional. Neste caso, a resolução significa o equilíbrio dos graves em relação aos médios, dos agudos em relação aos médios, dos médios em relação aos graves e agudos, etc. A Harman Target pode ser um bom ponto de partida para avaliar criticamente esse aspecto, embora algumas pessoas possam preferir ajustes para atender aos seus gostos e variações em regiões específicas, especialmente porque cada indivíduo possui um sistema auditivo diferente.

Harman AE OE 2018 Target, HE-1, HE400se — IEF Graph Tool (crinacle.com)

O termo resolução é mais amplo do que definição e é um termo amplo usado repetidamente nas análises dos audiófilos, que se refere à resolução geral em um fone de ouvido. Por outro lado, a definição é um termo menos abrangente, mas semelhante à ideia de resolução, e se refere a uma região específica, como ao dizer: “essa região específica tem uma boa definição”. Em resumo, a definição é menos ampla, enquanto a resolução é mais ampla, mas a ideia é a mesma, ou seja, que algo está equilibrado de forma geral ou em uma área específica.

O termo “incisividade de notas ou trailing end of tones é sinônimo de definição. Embora seja um termo recente, ele se refere à compreensão da definição de uma forma semelhante a outros termos já estabelecidos no texto. Quando mencionado, geralmente é associado a fones de ouvido que apresentam diferenças leves no volume entre as frequências de 3 kHz a 8 kHz, e essas diferenças de volume provavelmente influenciam na forma como os instrumentos agudos são apresentados, como é o caso do 64 Audio U12t.

Existem termos relacionais que tratam de descrever, com palavras, o que se sente ao ouvir o fone (alguns audiófilos chamam de colorações), como apresentação fria ou analítica e apresentação quente, suave, relaxada ou calorosa do som. No caso da apresentação fria, há uma presença mais acentuada dos agudos e médio-agudos (1-20KHz). No caso da apresentação quente, há uma presença mais acentuada dos médio-graves e sub-graves (20Hz até 300Hz) ou uma presença menos acentuada dos médio-agudos e agudos (1KHz até 20KHz). É importante destacar novamente que estes são conceitos relacionais, ou seja: é um desequilíbrio específico em relação às outras frequências e a demarcação colocada aqui é apenas uma referência geral.

Exemplo de fone mais quente (Verité) e fone mais frio (HD800) — Harman AE OE 2018 Target, Verite (Verite), HD800 S2 — IEF Graph Tool (crinacle.com)

Além disso, outros termos subjetivos, como “enlameado”, “sujo”, “áspero” e “gritante”, também são conceitos relacionais. “Enlameado” ou “sujo” pode se referir a frequências graves e médio-graves, enquanto “gritante” se refere a médio-agudos e agudos. Por sua vez, “áspero” ou “brilhante” são usados para descrever agudos e agudos acima de 10KHz.

De volta ao tema do detalhamento, algumas pessoas distinguem o detalhamento em microdetalhamento e macrodetalhamento. Estes termos se referem ao mesmo conceito abordado na seção de resolução e definição. O microdetalhamento é relacionado à região dos agudos mais altos, ou seja, agudos acima de 10KHz, enquanto o macrodetalhamento abrange toda a resposta de frequência, especialmente na faixa entre 100Hz até 8KHz. O termo “microdetalhamento” e “macrodetalhamento” é frequentemente vago e pode ser comparado à noção de “resolução”.

O termo “imaging ou separação de som” é similar ao conceito de resolução. Refere-se à habilidade dos fones de ouvido em permitir uma boa distinção entre os instrumentos em uma música, os sons em um jogo, o posicionamento dos sons separados na produção da mixagem da música. Adicionalmente, existe o conceito complementar de “resolução de passagens complexas em uma música”. Embora possa parecer complexo, o conceito de imaging é muito semelhante ao de resolução, mas destaca-se que existem regiões de maior importância. As regiões de médios (100–1.7KHz) e agudos (4–10KHz) são particularmente relevantes para a sensação de posicionamento e definição dos sons fundamentais dos instrumentos, permitindo uma melhor distinção dos sons em uma música. Em resumo, imaging se refere à definição nas regiões de médios (100–1.7KHz) e agudos (4–10KHz).

É importante observar que a apresentação da música pode ser afetada pela produção no estúdio, incluindo a gravação, mixagem e masterização. Dessa forma, a mesma música pode soar com mais detalhes em um fone de ouvido, mas pode não soar tão detalhada em outro. O mesmo se aplica a outros termos, como definição, resolução, entre outros.

Além disso, essa variação também pode ser observada em jogos, filmes e séries. Há até mesmo a noção de separação ou imaging específica para jogos, no entanto, distinguir os passos dos inimigos e os sons das armas requer tanto uma boa resolução quanto a minimização de mascaramentos e excessos na resposta de frequência. Portanto, as condições para um bom imaging na música não diferem das condições para um bom imaging em jogos.

Em adição, a consistência da resposta de frequência entre os canais esquerdo e direito também é um aspecto importante a ser considerado, mesmo que não seja amplamente destacado. A falta de consistência pode afetar a sensação de imaging na apresentação de músicas, trilhas sonoras e jogos que possuem sons alternados entre os canais direito e esquerdo do fone de ouvido. Na minha experiência pessoal, eu não considero esse efeito como extremamente importante, mas é uma questão relevante para ser levada em conta.

No que diz respeito a músicas, filmes e séries que possuem uma mixagem ou masterização consideradas inadequadas, é possível que a aplicação de uma equalização no fone de ouvido possa melhorar a audição e torná-la mais agradável. No entanto, é importante mencionar que os resultados da equalização podem variar e que a configuração utilizada para uma determinada música pode não ser apropriada para outras. Com base na minha experiência pessoal, é comum que músicas dos anos 70 até o início do século XXI apresentem irregularidades nos agudos e um equilíbrio menos favorável na região dos sub-graves (20 a 80 Hz).

Finalmente, há o conceito de palco sonoro ou soundstage, que é talvez o termo mais difícil de explicar e envolve muitas nuances. No entanto, os fones de ouvido considerados como mais espaçosos tendem a ter uma redução na faixa de frequência entre 1–4kHz. Alguns exemplos incluem o AKG K701, AKG K712, HD800, HD700, HarmonicDyne Zeus, Hifiman XS, Hifiman Ananda e Hifiman Arya. A característica da redução nessa região já é mostrada nas Blauert Bands na posição frontal, correlaciona com a percepção frontal da HRTF da maioria dos indivíduos.

About JENS: Sound Localization In The Median Plane — The Science of Sound (science-of-sound.net)

É claro que cada um desses fones apresentará essa faixa de frequência com níveis diferentes de volume em uma ou outra frequência, mas todos eles são caracterizados como tendo um bom palco sonoro. A redução nessa faixa de frequência geralmente proporciona uma sensação de maior distância entre vozes, guitarras e outros instrumentos.

É possível imaginar uma sala de aula em que se está na primeira fila, a voz do professor será muito mais evidente; se estivermos na última fila, provavelmente ouviríamos o professor muito menos. É claro que esse exemplo depende da acústica da sala de aula, mas na maioria dos casos, esse será o efeito percebido. Na percepção do indivíduo localizado na parte traseira da sala, a faixa de frequência mais reduzida será a dos médios-agudos, o que resultará na sensação de maior distância em relação ao professor.

Facts about speech intelligibility: human voice frequency range (dpamicrophones.com)

Esses fones também apresentam uma redução na faixa de frequência entre 6 a 10 kHz, mas essa redução não é tão importante para a sensação de distância quanto a região já citada anteriormente. É importante lembrar que o palco sonoro se refere apenas à sensação de espaço e não necessariamente ao posicionamento dos sons. O posicionamento dos sons é o que é caracterizado como imaging, e que já foi discutido anteriormente nesse texto.

Além disso, é importante levar em consideração a sensação tátil dos sons ao redor dos ouvidos, bem como a dimensão das almofadas auriculares do fone, a distância entre o fone e os ouvidos, e o tamanho dos alto-falantes em relação aos ouvidos, pois todos esses fatores podem afetar a sensação da dinâmica dos sons e do palco sonoro. No entanto, é importante destacar que essas considerações são altamente relativas e difíceis de serem avaliadas de maneira objetiva.

Finalmente, existem os softwares que empregam a média da HRTF (função de transferência relacionada à cabeça) e PRTF (função de transferência relacionada aos ouvidos) frontal ou variada dos indivíduos para virtualizar sons de forma direcional, imitando a sensação de que os sons são transmitidos naturalmente para nossos ouvidos a partir do espaço. Entretanto, essa média nem sempre é suficiente para produzir um efeito satisfatório e, nesses casos, a virtualização é feita para criar uma sensação de soundstage diferenciada. O efeito do software não é necessariamente comparável à redução dos médios-agudos e pode soar artificial e forçado, pois a finalidade é trazer uma relação mais realista com o espaço e não apenas aumentar um pouco a sensação de distância das músicas e demais conteúdos sonoros.

Obviamente, as demarcações aqui são apenas especulações, não são dados científicos.

Por fim, pode ser interessante ler sobre equalização em fones de ouvido e as características técnicas em fones de ouvido. Os textos serão linkados aqui.

--

--