La definición de la visión humana

Lo lamento, pero primero un poquito de anatomía del ojo…

El globo ocular es un órgano extensión del cerebro, de forma esférica bastante perfecta excepto en casos de patologías, de unos 7,5 g de peso. Su diámetro es de unos 24 mm; en los hipermétropes es ligeramente más chico, y en los miopes, por lo contrario, es mayor. El diámetro varían con la edad ya que en el momento de nacer es de unos 17 mm.

Lo que parece una lentilla y que está al frente del ojo, protegiéndolo y siempre húmeda es la córnea. La transparencia, falta de cicatrices y rayones en la córnea la hacen más transparente y por lo tanto permite entrar a los distintos rayos de luz con mayor facilidad. Si está ulcerada, tiene cicatrices o rayones, ocurrirá lo contrario. La córnea frente a la pupila es de 500 micrones (1u = 1 milésimo de mm). De allí la extrema fragilidad de esta capa fibrosa.

La esclerótica es lo que llamamos comunmente “lo blanco del ojo”. En la esclera se insertan los músculos externos que mueven a los ojos y de su parte posterior sale el nervio óptico, formado por las fibras nerviosas de las células ganglionares de la retina.

El iris se encuentra entre la córnea y el cristalino. Es un circulo de color que va desde el marrón oscuro, pasando por varias gamas del verde, celeste o gris. Sí, es lo que da el color a los ojos. El default es castaño~negro y el iris azul, verde o gris son variaciones o fallas genéticas. El iris, como su nombre lo indica actúa como un diafragma que se cierra ante la presencia de mucha luz o se abre cuando es escasa o nula. Participa del sistema dióptrico del ojo al contribuir a la convergencia de los rayos luminosos sobre la mácula.

El cristalino es una lente biconvexa, transparente e incolora. Está ubicada por detrás del iris y por delante del humor vítreo. Su diámetro es de 10 mm y su espesor central, de 4 mm.

El fotocaptor del ojo que se lláma retina. Se trata de una estructura delgada y transparente formada por tejido nervioso. Si pudieramos ver un corte transversal con un poderoso microscopio nos encontraríamos que está formada por diez capas sucesivas.

La capa más externa — el epitelio pigmentario — está en contacto con la coroides que es como si fuera lo que contiene a los humores líquidos del ojo. Las restantes nueve capas internas son de tejido nervioso, similar al del cerebro, y funcionalmente están formadas por tres grupos de neuronas muy especializadas: fotorreceptores (las más externas), bipolares (intermedias) y ganglionares (internas).

El fondo del ojo es “lo rojo” que vemos en las fotos. En él se destacan dos zonas de gran interés funcional y patológico: la papila, la mácula y los vasos.

La papila — denominada también disco óptico — determina una mancha ciega en el campo visual. Es el rasgo más característico al observar el fondo de ojo. Es de color blanco amarillento con una forma redondeada bien definida, algo ovalada en sentido vertical, de un diámetro aproximado de 1,5 mm. Contiene la arteria y vena centrales de la retina y no es fotosensible.

La mácula es la parte central de la retina. Se sitúa en el eje visual, donde se encuentra la mayor concentración de conos y la mejor discriminación de la forma y del color. Tiene un tamaño similar al del disco óptico.

Ahora que sabemos dónde está cada cosa, veamos como funcionan.

Los estímulos luminosos que percibe el organismo provienen de la función visual, que discrimina las formas y colores, enfoca a distintas distancias y se adapta a diferentes grados de iluminación. Mediante la visión binocular y la fusión se obtiene la visión en profundidad o en relieve (estereopsis), o sea la visión tridimensional. Las formas se aprecian por la diferencia de iluminación de los distintos sectores de la imagen proyectada (sensibilidad al contraste). Esta variedad de estímulos impresiona los fotorreceptores (conos y bastones) en forma desigual, lo que permite la captación de esas diferencias.

Se debe tener en cuenta que la visión más discriminativa es la central y depende de los receptores llamados conos, responsables de la visión de los colores ubicados en la mácula. Éstos necesitan mucha luz para ser estimulados, razón por la cual la visión central se denomina fotópica. Los bastones, ubicados más periféricamente en la retina, tienen un umbral de excitación más bajo; por lo tanto son excitados en ambientes con poca iluminación. Los fotoreceptores no existen en la zona macular. La visión nocturna, de la penumbra o crepuscular está a cargo de la retina periférica y se conoce como visión escotópica; su poder de discriminación, medido como agudeza visual, corresponde a 1/10 de la visión fotópica.

El mecanismo por el cual un estimulo físico luminoso se transforma en uno nervioso es un fenómeno fotoquímico que tiene lugar en el nivel de los fotorreceptores, en los cuales la púrpura retiniana se transforma en retineno y una proteína, que pasa de posición cis a trans, en presencia de la luz. Esta transformación genera una diferencia de potencial (voltaje) y el proceso químico es reversible.

A qué llamamos resolución ocular

El ojo tiene un límite para identificar como separados dos puntos próximos. Hay recordar que la materia está formada por moléculas y átomos separados, pero lo que nos muestra el ojo al mirar la materia es un todo continuo. El poder de resolución se refiere a la capacidad para resolver o distinguir dos objetos que están muy juntos.

Una película cinematográfica negativa de 35mm puede discernir de 7 a 8 mil puntos diferentes de izquierda a derecha en el área sensible del total fotosensible del fotograma. Hay scanners que disciernen seis mil puntos (6k), otros, más comunes 4k, mientras que la gran mayoría discierne 2000 puntos (2k). Un CCD de las cámaras de High Definition se acercan a los 2k, pero en el caso de los ojos, esto no puede ser medido de esta forma (por miles de puntos) sino por fracciones de grado. Cada ojo (sano, joven, en condiciones normales, con iluminación suficiente, pero moderada) es capaz de definir objetos separados por 1 minuto de grado (1° = 60 minutos o 1/60 de grado). Con lo cual, para medir la calidad visual lo que se mantiene constante es el ángulo, no el tamaño del objeto. Como la distancia mínima entre 2 conos es de 4 micras, y conocemos las medidas y la potencia de la lente del ojo, hemos averiguado este ángulo, que es como ya dijimos, de un (1) minuto lo que en lo absoluto significa que sea un píxel.

Los rayos que entren con un ángulo menor a 1 minuto no los veremos como diferenciados, con lo que es precisamente este ángulo el que define la agudeza visual.

Es decir: el ángulo mínimo = 1 minuto significa agudeza visual del 100% (teórica)

Obviamente este ángulo abarca más distancia cuanto más lejos estén los objetos observados del del ojo. En otras palabras, el detalle más pequeño que podemos percibir tiene que ser más grande cuanto más lejos se encuentre. Pero hay otros factores que lo condicionan: el tamaño de las células de la retina, la longitud de onda de la luz y el diámetro de la pupila. Ya habíamos dicho que la luz llega al fondo del ojo atravesando antes el orificio del iris llamado pupila.

Debemos recordar que cuando un haz de luz atraviesa una ranura pequeña se difracta (se abre) y colocando frente a ella una pantalla se observan figuras de interferencia en las que alguna zona queda oscura (luz + luz = oscuridad) formando los famosos círculos de confusión o CoC.

Las personas que tengan un menor ángulo mínimo en el que se produce la difracción tendrán una mayor agudeza visual en presencia de mucha intensidad lumínica.

Vamos a tomar algunos números de la persona sana, joven y sin patologías.

La apertura de la pupila promedio en un adulto sin ayudas visuales es de unos 5 mm de diámetro (DP).

El ángulo crítico para un ojo normal lo dan el diámetro de la pupila (DP) y la longitud media de la luz visible (600 nm) y vale:

q crítico = 1,22 ( 6·10 -7 / 5·10 -3) = 1,46·10 -4 rad = 5' de arco.

Este ángulo mínimo es el ángulo de agudeza visual de esa persona. Lo cual es bastante menor (en realidad es menor la agudeza y 5 veces mayor el arco) a el número teórico de 1' de arco. Otro factor limitante del poder de resolución del ojo es la separación de los receptores (conos) en la retina debido al tamaño de estas células y que puede variar considerablemente de una raza a otra y entre los individuos de esa misma raza a otros.

El ojo distingue dos puntos como distintos (separados) cuando la imagen de los mismos se forma en células sensibles distintas. La separación de los conos en la fóvea central (que es como una pozo cónico que está en el eje óptico) es de 1 micrómetro y en otras zonas de 3 a 5 micrómetros que para un globo ocular de 2,5 cm de diámetro lo que nos da un ángulo de agudeza visual de 2 a 5 minutos de arco.

El Poder Separador del ojo es el valor inverso del ángulo de agudeza visual.

¿Qué tiene de especial la fóvea?

Los fotorreceptores, esas células que reciben la luz, están muy juntos, y son conos alargados. Cuanto más juntos están los receptores, mejor resolución tenemos, imágenes más nítidas. Cada uno de estos conos tiene su propia fibra nerviosa.

El tamaño de las células condiciona el ángulo de agudeza visual. Pero la la longitud de onda y el diámetro de la pupila también lo determinan. Es decir que el “q” crítico puede ser menor a una misma apertura de pupila si la luz es de mayor longitud. Los dos factores conducen al mismo valor. La evolución del sistema de la vista en los humanos, quizás ajustó uno al otro.

Los instrumentos ópticos aumentan el ángulo de agudeza visual y lo que a simple vista parece un punto puede revelarse como dos puntos separados.

Ahora ustedes se estarán preguntando, “¿Pero cuantos megapíxeles o elementos fotosensibles tiene el ojo?”. Tenemos unos 200 millones de receptores de la retina, de los cuales sólo 150.000 cumplen esta función de retina central, y por tanto del millón de haces nerviosos que hay en el nervio óptico, sólo 150.000 se ocupan de la “visión de alta resolución”. El resto, cuantitativamente es más grande, pero funcionalmente mucho menos importante. Nuestros ojos tienen mucha resolución en poco espacio, el resto de la retina verá borroso, no nítido y “pixelado”. Pues así es. Además recordemos que influye el “q” critico la longitud de onda de la luz y la distancia al objeto.

La zona periférica de la retina es más sensible a la luminosidad. Los conos son los responsables de la visión en color de de alta resolución, se acumulan en el centro y van perdiendo densidad. En la zona periférica no hay conos. Los bastones son el otro tipo de receptores y son la mayoría. Doy algunos números para hacer una idea: los conos son unos 7 u 8 millones (de los cuales 150.000 están en la zona central) y los bastones son unos 130 millones. Los bastones, mucho más numerosos, no nos dan información de los colores ni tampoco dan una definición buena de la imagen. Sin embargo tienen mucho mejor sensibilidad, de forma que se encargan de la visión nocturna. Los conos necesitan mucha intensidad de luz para funcionar y se encargan fundamentalmente de la visión diurna (y con luz artificial, claro).

La fóvea y la zona de alrededor que todavía tiene buena resolución de imagen ocupan apenas unos 3 grados de visión, de los 120º de campo visual que tiene un ojo. O sea, justo el centro. Por eso sólo vemos enfocado lo que está exactamente en el centro de nuestra visión. Esto no es así en el film, ni en los CCDs, ni en los CMOS.

Hay varios experimento sencillo para notar que no todo el ojo tiene la misma agudeza visual. Se puede probar leyendo un cartel a lo lejos. Luego se debe intentar leerlo sin mirar exactamente al cartel, sino a otro objeto un poco al lado. Es una prueba difícil de hacer porque los ojos se mueven automáticamente a lo que querríamos ver, es casi involuntario. Pero si se consigue tener la mirada un poco apartada, descubriremos que no lo podemos leer. Reconoceremos los colores del cartel, pero no tendremos suficiente nitidez para leerlo.

Otro experimento: observar los ojos de alguien que está leyendo un papel. Los ojos van dando saltitos muy rápidos de izquierda a derecha, y cuando acaban la línea, un salto grande de derecha a izquierda. Esto es porque sólo podemos leer lo que cae en la fóvea, y tenemos que estar desplazando constantemente la mirada hacia el siguiente grupo de palabras. Si nuestros ojo tuviera la misma capacidad de resolución en toda la retina, leeríamos “de un golpe de vista”, no tendríamos que irnos desplazando por el papel.

Hollywood descubrió a fines de los ’50 que en las pantallas anchas miramos únicamente el tercio central de la pantalla y que si se trata de dos personajes enfrentados uno en cada tercio lateral, miraremos a uno y a otro alternativamente, con excepción de los argentinos que leeremos los subtítulos que están en el centro.

La estereópsis del desacuerdo.

Si ambos ojos están sanos y alineados, tendrán igual acceso a los centros visuales en el cerebro, el que integrará la imagen captada por cada uno será integrada en una sola en un proceso que se conoce como fusión, proceso del que no se tiene un acabado conocimiento y si muchas teorías. La capacidad de fusionar tiene una consecuencia importante para el individuo: mediante la estereópsis podemos ver en tres dimensiones con una real sensación de profundidad, es decir podemos discriminar dos puntos separados espacialmente (en el sentido adelante-atrás) a un nivel superior al de la agudeza de Snellen (el que inventó las cartillas con las cual nos torturan los oftalmólogos). Consideremos que los elementos de las letras de Snellen están separados por un minuto o 60 segundos de arco, pero la estereopsis es capaz de una discriminación espacial a un nivel mejor que 10 segundos de arco. Por esta razón la estereopsis es considerada una forma de hiperagudeza. Quiere decir que con un ojo tapado teóricamente podemos ver objetos separados por 1' de grado, pero con ambos ojos destapados podemos ver teóricamente objetos separados por 10". En la práctica y no en las condiciones ideales de la carta de Snellen son 5' y 1' respectivamente. La cantidad de pixeles es una forma inexacta de hablar de resolución de imagen de los ojos. Lo importante es el tamaño del punto más pequeño que podemos ver a una distancia dada. Podríamos comparar mejor con un monitor, sabiendo su tamaño de punto y la distancia a la que nos ponemos. No hagamos simplificaciones mecanicistas porque fallan. Concluimos que la fusión es el mecanismo que mantiene los ojos correctamente (gracias al cerebro) alineados y la estereopsis es la recompensa. Los japoneses, chinos, koreanos y yanquis saben que no todo el mundo entiende esto y por eso inventaron en UHD de 4k y ya experimentan en Tokio con 8 y 12k. Definición que un ojo normal no llegará a discernir (por separar los elementos que lo componen) a más de 1,5 mts de distancia para un monitor de 65" de diagonal.

El área fusional de Panum

De acuerdo al párrafo anterior puede darse la plopía (solapamiento de imágenes de ambos ojos) en el punto de fijación y, en consecuencia, en los puntos laterales al mismo, su imagen se forma en los distintos puntos periféricos correspondientes de cada retina. Esto da lugar a una superficie alrededor del punto de fijación denominada horóptero (se trata de una superficie en la escena contemplada).

En 1858, un tal Panum demostró, mediante pruebas experimentales, que no solamente las imágenes obtenidas por los conos correspondientes a cada ojo dan lugar a la visión única, sino que para cada punto de una retina existe un pequeño círculo o área de puntos en la otra retina cuya estimulación puede llevar a la fusión de ambos estímulos.

De este modo, la plopía no se da exclusivamente en el horóptero, sino que existe toda una región del espacio en las inmediaciones del mismo donde es posible la visión única. A esta región se le conoce como área fusional de Panum que es de baja definición. (Lo que llamamos ver por el rabillo del ojo).

Los objetos que se sitúen fuera de este área producirán diplopía fisiológica, por lo que se verán dobles. Lo curioso es que no somos conscientes de ver una parte nítida y una parte “desenfocada”. El cerebro y una serie de movimientos involuntarios de los ojos se encargan de ello.

Lo más increíble es que tenemos 200 millones de receptores con solo 1 millón de cables. Esto es porque el nervio óptico descarta información. ¡Qué mal noticia para muchos! ¡Nuestros ojos comprimen 200 a 1 y nosotros tan campantes! Hay que tener en cuenta otra cosa: nuestros ojos son una extensión del cerebro y son DIGITALES ya que los neurotransmisores usan un código binario: el receptor se excita por la luz o no se excita, y el haz que lleva la información del receptor al cerebro, transmite o no transmite. No hay término medio. Ceros y unos: la base del sistema digital. Con lo cual, si el cerebro recibe 1 millón de cables por ojo, cada cable en cada instante sólo puede dar una de las dos informaciones posibles (transmite o no transmite). No se puede interpolar la información intermedia, y si lo hiciera veríamos el mundo pixelado. Por eso menos podemos hablar de 2k, 4k y mucho menos de 8 o 12k.

Teorías de la visión binocular única

La obtención de una percepción única a partir de dos imágenes diferentes captadas por cada uno de los ojo, es bastante desconcertante. Por eso no es de extrañar que ese fenómeno haya motivado a lo largo de la historia una serie de teorías destinadas a explicarlo, desde las más cuerdas hasta algunas directamente descabelladas.

Entre las primeras explicaciones propuestas se encuentra la idea de que la imagen percibida por cada ojo es suprimida de forma alternativa. Posteriormente se propuso una supresión parcial alternante de fragmentos de las imágenes recogidas por cada retina, tipo guiñe de giro. ¡No hubo como fundamentarla!

Por mucho tiempo se pensó una especie de mosaico con porciones de imagen correspondientes a los dos ojos, como en el offset de los CCDs y CMOS. No está probada ni descartada, más teniendo en cuenta que el offset de los CCDs funciona perfectamente.

Otras teorías han asignado un papel capital en la estereópsis a los movimientos oculares de acomodación y convergencia, sin embargo, la fusión y la estereópsis ocurren aún sin que ello ocurra. ¡Descartada!

Ninguna de estas teorías explica de forma satisfactoria el fenómeno de la visión binocular única, e incluso en la actualidad, no se ha resuelto el asunto de forma definitiva, por lo que por el momento se supone que el cerebro de los animales de ojos simples tienen áreas de neuronas dedicadas a la integración de la visión estereoscópica.

La percepción de la profundidad

Los procesos y fenómenos que implican la visión binocular son muy complejos frente a la monocular, pero sus ventajas son muchas. Con solamente dos se justifica esta complejidad evolutiva: una mayor amplitud del campo visual, y la estereópsis o percepción de los volúmenes, distancias y profundidades que además representa un enorme cambio en la visión a nivel cualitativo, proporcionando un sistema mucho más preciso y con mejor calidad perceptual en la evaluación de las distancias. Puede comprobarse este punto observando cualquier estereogramas en la web (los hay por docenas).

Ahora, tengamos en cuenta que la estimación de las distancias no se realiza de forma absoluta, sino que se establece con relación al punto de fijación. La calidad de esta percepción mejora cuando las distancias al objeto van disminuyendo hasta un cierto límite. La máxima calidad se da en las distancias accesibles con el brazo extendido (yo para leer necesito brazos cada vez más largos). Este hecho se explica porque la sensación de profundidad se basa fundamentalmente en las diferencias existentes entre las imágenes captadas por ambas retinas, de forma que cuanto más cercano está el objeto, mayores diferencias existen. En realidad más allá de los 6 u 8 metros no tenemos visión estereoscópica. ¿Cómo comprobarlo? Con binoculares que aumentan la distancia de percepción de los ojos y logran un aumento de la estereópsis a distancias muchísimo mayores (unos 200 metros). Entonces ¿entendemos por qué el fútbol en 3D no tuvo suceso y el basquet en 3D con la cámara en la cancha si?

En este sentido, y dado que las disparidades surgen por la diferente posición de los dos ojos en una línea horizontal, las diferencias que puedan producirse entre las dos imágenes en sentido vertical, no producen estereopsis aunque tampoco la impiden.

“¡La vieja ve lo’ colore…!”

La visión cromática es una sensación que aparece en algunos de los organismos más evolucionados y que está a cargo de los conos. En la zona macular se observan los colores más brillantes dentro de la gama rojo-amarillo, mientras que en la retina periférica se perciben los azules. Hasta hace poco se suponía que nuestra visión era como el súper video Y/C (luminancia / crominancia). Que los conos veían los colores y los bastoncillos la luz, sin embargo hoy la teoría más aceptada (que se llama deYoung-Helmholtz) o tricrómica explica los tres tipos de receptores para los colores principales: rojo, verde y azul. Es decir que nuestros ojos en la zona macular es RGB como dios manda y en la periferia es monocromática como la TV de antes de 1980. De hecho cuando hay poca luz es muy difícil distinguir colores.

Don Young y Don Helmholtz descubrieron esto observando a discromatópsicos como quien escribe este artículo, que tenemos el espectro corrido o directamente los hay ciegos a uno o la totalidad de los colores.

Las alteraciones de alguno o de todos los conos producen anomalías o falta de visión de los colores. Pueden ser acromatopsias, (que quiere decir falta de visión de los colores). Los protánopes no ven el rojo, los deuteránopes no ven el verde y los triptánopes el azul o el violeta; pueden ser congénitas (rojo/verde o daltonismo) o adquiridas (por lo general no se percibe el azul/amarillo). Yo me encuentro entre los triptánopes, lo que me hizo recibir múltiples regañadas en la escuela por pintar la bandera argentina de violeta al que yo veía como el cerúleo perfecto.

Quedan detalles como los de la profundidad de color que captan nuestros ojos. No se trata de cantidad de colores sino que el ojo humano apenas puede diferenciar 10 mil colores cuando un monitor de 32 bits ofrece muchos más. A la absoluta mayoría los ve como tonalidades de grises con tonalidad.

Jorge Ricaldoni

Bibliografía y links:

Elementos de Física. Tebaldo J. Ricaldoni, Editorial Estrada.

The television camera. The other side. Jorge Ricaldoni. Divicom Inc. USA

Oftalmólogos y técnicos de la Clínica de Ojos Santa Lucía de La Plata.

Web:

Un tutorial introductorio a la visión estéreo:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/MARBLE/medium/stereo/stereo.htm

Visión estéreo, problemas e imágenes 3D. Presenta un enfoque más desde un punto de vista fisiológico:

http://www.vision3d.com/stereo.html

El problema de la visión en estéreo:

http://www.inria.fr/robotvis/demo/rkeriv/stereo.html

Investigación en la visión por computadora:

http://www.merl.com/threads/vision/index.html

Más sobre la estereopsis:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/HENKEL/research/stereo/

En este enlace, aparte de tratar aspectos generales de la visión artificial, se puede encontrar un apartado dedicado a la teoría de la imagen en estéreo:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/MARSHALL/

Aquí encontraremos una descripción matemática extensa de diversos aspectos relacionados con la visión estéreo:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/EPSRC_SSAZ/node13.html

Aproximación a la visión estéreo. Se encuentra también desde el punto de vista de las redes neuronales:

http://axon.physik.uni-bremen.de/~rdh

Visión estéreo por detección de coherencia:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/HENKEL/research/stereo/tyc/node1.html

Matemáticas elementales para el estudio de la visión artificial:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/BASICMAT/basicmat.html

Procesamiento binario de imágenes:

http://www.dai.ed.ac.uk/CVonline/LOCAL_COPIES/MARBLE/medium/binary/

Percepción de la profundidad. Principios de la visión estéreo desde un punto de vista más psicológico. Con muchos ejemplos:

http://server.esc.cquest.utoronto.ca/psych/psy280f/ch7/chapter7.html

Enlace a una extensa lista de lugares relacionados con la visión tridimensional. Muy variada y completa:

http://www.dddesign.com/3dbydan/3dlinks/linksz.htm

Visión estereoscópica. Uno de los pocos lugares en castellano. Breve pero clara:

http://www.users.inycom.es/~agonzalez/vision.htm

Página relacionada con la visión artificial (Departamento de Inteligencia Artificial de la U.N.E.D.) Muy completa:

http://www.dia.uned.es/ia/asignaturas/vision/

Información y recursos sobre visión estereoscópica:

http://www.3d-web.com/

Por Jorge Ricaldoni (C) 2003~2017 Puede ser reproducido citando la fuente y al autor.

Like what you read? Give Jorge A. Ricaldoni a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.