Resumen de Leturas

José Armando Berrocal Abensur
BigDataLatam
Published in
2 min readOct 21, 2019

Lectura 1 | Artwork Personalization at Netflix

Netflix utiliza la información de nuestas selecciones previas para mostrarnos nuevas opciones de peliculas, dependiendo de nuestras elecciones se procede a hacer un analisis personal de nuestros posibles gustos.

Hace una evaluacion de los diferentes artworks para ver cuales son los mas ideales y eficientes en cada tipo de publico

Dependiendo del tipo de peliculas elegidas, nos podra sugerir nuevas peliculas de un mismo genero y/o artista, esta sugerencia se notará en su artwork, una misma pelicula tendra diferentes artworks, unas para hacer notar artistas en especifico, el genero de la pelicula, etc

La personalización del artwork es un reto a tomar, elcambio de este podria afectar la identificación de una pelicula por parte del usuario

Otro de los problemas es que el sistema deba ser lo suficientemente robusto para hacer este proceso por cada uno de los requerimientos de sus 20 millones de clientes.

Muchas de las respuestas del motor de recomendaciones usa batch algoritmos de machine learning, nuevas propuestas son usadas en un segmento del cliente, si se observa mejoras en comparación de otro segmento se procede a implementar en todos los clientes, esto generará insatisfacción en un gran número de clientes, como solución a este problema se paso a usar algoritmos online machine learning personalizado lo cual permite adaptar las preferecias en tiempo real de cada cliente por individual.

El entrenamiento del modelo para cada caso individual se da gracias a las elecciones de los diferentes artworks, titulos

Las bandas contextuales que se usan para la elección de los futuros artworks, usa como referencia los titulos, el pais de origen, preferecias idiomaticas, el equipo del cual se reproduce, el dia que se reproduce, asi como futuras recomendaciones

Lectura 2 | Python at Netflix

Python, es usado en todo el proceso del ciclo de vida del contenido, se puede usar para revisar el estado de la plataforma, para trabajos automaticos dentro de la plataforma, alertas, diagnostico, automatización. Asimismo para encargase de la seguridad misma de la información, encontrar vulnerabilidades y analisis de riesgos, sin olvidar que se usa para la personalización de algoritmos en artwork y marketing, tambien para las otras aplicaciones donde tambien se usa machine learning, asi como con la interacción con el universo jupyter. Aparte se usa para visualizar posibles analisis dentro de la plataforma. La codificación del video tambien puede ser tratado por python.

Lectura 3 | Building and Scaling Data Lineage at Netflix to Improve Data Infrastructure Reliability, and Efficiency

Para hacer un sistema escalable en netflix se debe asegurar la seguridad de la data, el diseño de un modelo flexible, asi mismo que la plataforma en si tenga una buena integración entre sus diferentes componentes.

Tambien tenemos que tener en consideración las diferentes opciones de ingesta de data, de metadatas, de las aplicaciones mismas de netflix, de las preferencias del usuario mismo; estas diferentes opciones van a forzar la escalabilidad, la plataforma debe estar adecuada para poder adaptarse a estos cambios; asi mismo considera que el procesamiento de esta información tambien requerirá que la plataforma se adapte al procesamiento de toda esta información.

--

--