WEKA PARA EL ANALISIS DE DATOS

Cristian casas
3 min readOct 21, 2020

--

¿QUE ES WEKA?

WEKA: es un software de código abierto que proporciona herramientas para el preprocesamiento de datos(mineria de datos), además de implementar varios algoritmos de aprendizaje automático y herramientas de visualización para que pueda desarrollar técnicas de aprendizaje automático y aplicarlas en los problemas de minería de datos del mundo real. Qué
Las ofertas de WEKA se resumen en el siguiente diagrama:

¿QUE OFRECE WEKA PARA EL ANALISIS DE DATOS?

diagrama de flujo de lo que hace weka

Si observa el comienzo del diagrama de flujo de la imagen, comprenderá que hay muchas etapas en el manejo adecuado de Big Data: Primero, comenzará con los datos sin procesar recopilados del campo. Estos datos pueden contener varios valores nulos y campos irrelevantes. Utiliza las herramientas de preprocesamiento de datos proporcionadas en WEKA para limpiar los datos. Luego, guardaría los datos preprocesador en su almacenamiento local para aplicar ML(Machine Learning Algorithms).

en el segundo paso , según el tipo de modelo de algoritmo de Machine Learning que esté intentando desarrollar, seleccionaría una de las opciones como Clasificar, Agrupar o Asociar. La selección de atributos permite la selección automática de características para crear un conjunto de datos reducido es decir la Selección de los datos

Tenga en cuenta que en cada categoría, WEKA proporciona la implementación de varios algoritmos. Debería seleccionar un algoritmo de su preferencia y establecer los parámetros deseados y ejecutarlo en el
conjunto de datos el cual tendrá una salida estadística del procesamiento del modelo.

en la imagen se puede observar la herramienta que tiene WEKA para visualizar los datos

WEKA Te proporciona una herramienta de visualización para inspeccionar los datos. Los distintos modelos de minería de datos se pueden aplicar en el mismo conjunto de datos, A continuación puede comparar las salidas
de diferentes modelos y seleccione el mejor que se adapte a su propósito.

¿QUE TIPO DE DATOS RECIBE WEKA? 🤔

es importante que primero debe limpiar sus datos. Esto se debe a que los datos brutos recopilados en el campo pueden contienen valores nulos, columnas irrelevantes, etc. aprender a pre-procesar los datos es importante para el conjunto de datos y así no entorpecer el análisis

WEKA admite una gran cantidad de formatos de archivo para los datos. Aquí está la lista completa:

.arff  .arff.gz  .bsi  .csv  .dat  .data . json  .json.gz  .libsvm  .m .names  .xrff  .xrff.gz

Los tipos de archivos que admite se enumeran en el cuadro de lista desplegable en la parte inferior de la
pantalla. Esto se muestra en la captura de pantalla

Por lo tanto, el uso de WEKA da como resultado un desarrollo más rápido de modelos de aprendizaje basados en algoritmos Machine Learning en un conjunto de datos.

creado por: Cristian Casas, Yadir echeverri, Sharon delgado

--

--