Competencias para formar en ciencia de datos desde las universidades

Published in

qu4nt

5 min readJan 6, 2019

Cortesía de Christina Morillo en Pexels.com

Aunque la evidencia nos esté demostrando que cada vez son menos lo profesionales y expertos en ciencia de datos que lo han aprendido en aulas universitarias al uso, lo cierto es que aún en estos tiempos, las universidades siguen dictando cursos de programación y graduando profesionales orientados al diseño y desarrollo de sistemas.

Sin embargo, el análisis de datos, la identificación de datos útiles a la toma de decisiones en ámbitos de negocio privados y públicos, la construcción de información necesaria para la acción particular y colectiva, y la estructuración de visualizaciones útiles para el aprendizaje a partir de estas experiencias, demanda no sólo procesos de formación más flexibles, sino también contenidos más dinámicos y orientados hacia perfiles autónomos de profesionales, más que hacia la formación de trabajadores de empresas.

Esta última afirmación, aunque necesaria, me llevaría a abordar un análisis distinto al del artículo, con un detalle y contextualización mayores. Hacerlo es algo que postergaré para centrarme en una reseña del artículo referido antes. Sin embargo, lo que si considero importante establecer es que no sólo deben reorientarse los contenidos, sino también los procesos de aprendizaje, la pedagogía y, sobre todo, el acceso a estos contenidos por parte de segmentos de población que resultan excluidos de procesos formales de aprendizaje.

En Abril del 2018, el magazín EdTech publicó un artículo titulado “Las cuatro cosas que las universidades deben saber sobre enseñar ciencia de datos”, donde la autora aborda cuatro aspectos en los cuales debían centrarse las universidades para formar capacidades en el ámbito de la ciencia de datos.

El artículo firmado por Meghan Bogardus Cortez, quien es editora asociada en EdTech, establece como principal argumento que, dada la omni presencia de tecnologías que recogen y analizan datos en nuestra cotidianidad, las universidades deben montarse en la ola de la formación de capacidades para atender esta realidad.

La autora se apoya en declaraciones del director de Inteligencia Artificial de Amazon, Guy Lebanon, y en el informe Training students to extract value from big data, publicado en 2015 por la Academia Nacional de las Ciencias, la Ingeniería y la Medicina de Estados Unidos (NASA por sus siglas en inglés).

A juicio de Lebanon, en los próximos años será determinante el aprendizaje de tres dominios de conocimiento: ingeniería de software, machine learning y sentido de producto. Sin embargo, como en otros ámbitos del saber, no se trata tanto de las capacidades que, de forma individual, las personas adquieran durante su proceso de formación, sino la vinculación que de éstas hagan para un análisis y desempeño más adecuado al contexto del análisis de datos.

La combinación de éstas y otras competencias es la que, en definitiva, hará la diferencia en el desempeño de cualquier profesional de la ciencia de datos. Por ejemplo, la automatización del aprendizaje de las herramientas diseñadas gracias a la ingeniería de software, y su orientación al desarrollo y consolidación de productos en el mercado, no sólo es posible desde una mirada muy particular hacia cada una de las competencias deseables descritas antes, sino, sobre todo, se hace viable desde una perspectiva integral e integradora del contexto en el cual la solución sería aplicada gracias a un análisis de datos precedente.

¿Sólo capacidades técnicas?

¡De ninguna manera! El desarrollo de las capacidades técnicas enunciadas es responsable del desarrollo de una habilidad, seguro no incluida de modo explícito en los pensa universitarios: el pensamiento crítico.

While students who want to work in data science need to know the technology, they will also need to harness critical thinking during the data analysis and exploration process.

En este contexto, se desprenden otras disciplinas que deben ser no sólo conocidas, sino también manejadas por quienes se estén formando en el área de ciencia de datos: conocimiento gestión de la incertidumbre, métodos y análisis estadísticos, programación y tecnología (mejor si es de código abierto).

A juicio de Duncan Temple Lang, jefe de la Iniciativa de Ciencia de Datos de la Universidad de California Davis, pueden resumirse en diez los pasos que forman parte de todo proceso de análisis y exploración de datos:

Hacer una pregunta,
Refinar la pregunta identificando los datos,
Obtener los datos de acceso,
Transformar estructuras de datos para el análisis,
Comenzar el análisis y determinar si los resultados se escalarán,
Reducir las dimensiones de los datos recogidos,
Generar datos de modelos y estimaciones,
Diagnosticar qué tan bien se ajusta el modelo a los datos,
Cuantificar la incertidumbre en los resultados, y
Transmitir los resultados.

Para cada uno de ellos, a buen seguro, hay al menos una capacidad de necesario desarrollo en profesionales del área de ciencia de datos.

Es por ello que el proceso de formación de capacidades para la ciencia de datos, concluye el artículo, debe orientarse hacia la interdisciplinariedad. Sin embargo, los profesionales de áreas distintas a la computación, la ingeniería de software o la estadística, ciertamente están en una importante desventaja pues sus contenidos curriculares, en su mayoría, no incluyen temas relativos a la ciencia de datos y sus procesos.

La ciencia de datos debe ser, entonces, una habilidad a desarrollar entre todos los profesionales en formación, tal como se incluyen habilidades técnicas.

Pero esta interdisciplinariedad y el fomento del pensamiento crítico, no sólo se logra con la incorporación de nuevos contenidos a los pensa. Un elemento no descrito de modo explícito, tiene que ver con la incorporación de estudiantes con distintos orígenes entre los grupos de formación, aprendizaje e investigación.

El acceso a distintas visiones de mundo y origen, según los autores del informe, posibilita la construcción de visiones de contexto y conjunto mucho más acertadas y, por tanto, mucho más eficaces en el proceso del análisis de datos.

¿Todes somos iguales?

Algo que no aborda ni el artículo reseñado ni el informe, es el problema con los segmentos de población que quedan sistemáticamente excluidos del acceso a procesos de formación en áreas tan necesarias como la ciencia de datos.

Uno de estos sectores, el de las mujeres, ha sido demostrado una, otra y otra vez, se ven altamente beneficiados del acceso a procesos de aprendizaje, formación e investigación, centrados en tecnologías de información y orientados hacia su empoderamiento en la era de la economía digital.

Y bien sabemos que cuando hablamos de empoderamiento, no lo hacemos desde la superficialidad e insuficiencia del acceder a nuevas fuentes de ingresos. Lo hacemos desde la perspectiva de una búsqueda por la construcción de nuevas formas de mirar el mundo desde una observación bastante más inclusiva e incluyente.

Pero de eso, seguro, estaremos hablando en futuros artículos.

Competencias para formar en ciencia de datos desde las universidades

¿Sólo capacidades técnicas?

¿Todes somos iguales?

Written by Mariángela Petrizzo