Minería de Datos: El análisis de datos para predicción de accidentes de tránsito ocurridos en el departamento de Boyacá

Lizzethik
Lizzethik
Nov 2 · 4 min read

La accidentalidad de automóviles es un problema que ha estado siempre vigente, es por esto que vamos a realizar un análisis de los datos obtenidos de la página del Observatorio Nacional de Seguridad vial desde el año 2017 a julio del 2019 que involucra lesiones y fallecidos en accidentes de tránsito en toda Colombia, cuya información se encuentra disponible en la página https://ansv.gov.co/observatorio, esto con el fin de evaluar las diferentes causas que provocan los accidentes de tránsito en el Departamento de Boyacá, atreves de técnicas de pre-procesamiento para mejorar la calidad del dataset, se emplearán algoritmos de minería de datos y la aplicación de la metodología CRISP-DM la cual se divide en fases que es la mas comúnmente utilizada para trabajos con minería de datos.

Los accidentes de tránsito se han convertido en un problemática creciente, que cada día cobra más vidas en Colombia, durante el año 2018 las víctimas fatales fueron 4780 en comparación a las cifras presentadas en lo que lleva el año 2019 la cual equivale a una reducción del 0,4% lo que equivale a 19 víctimas menos frente al mismo periodo del 2018, para el total nacional y 25.476 lesionadas una disminución del 6,59% en el total de lesionados, en comparación con el año anterior. No obstante a pesar de mostrar una deducción no significan que el número de fallecidos no tiende a aumentar en los meses restantes del 2019

Actualmente la gran influencia de las Tecnologías de la Información y la Comunicación (TIC) ha hecho de la minería de datos un gran diferenciador en la toma de decisiones, en la obtención de patrones predictivos. Por ello el uso de estas técnicas al ser implementadas se podrán tomar características tomadas de un conjunto de datos llamado: dataset para este caso en particular de accidentes de tránsito y lesionados en Colombia, no solo es posible encontrar relaciones entre la gravedad de las lesiones y las características del conductor de un vehículo involucrado o entre variables como estado de las vías y condiciones ambientales, sino algunos datos relevantes, con los cuales se desean generar patrones dentro de los datos reportados en accidentes de tránsito que permitan orientar medidas preventivas.

Para el análisis de estos datos se realizó desde el software Knime y anaconda con su herramienta Jupiter nobookk para determinar los datos por cada item de la tabla con los cuales vamos a obtener los resultados de los datos y así poder pasar al posterior análisis de estos resultados.

Se realizó una limpieza de datos y un filtrado de columnas para que los datos obtenidos fueran más reales y así generar análisis que tenga mejores resultados, también se desarrolló un análisis exploratorio donde obtuvimos un gráfico de barras donde se muestra que el departamento de Boyacá es uno de los que más presenta accidentes en el país.

Modelo en knime para análisis exploratorio
Histograma del análisis exploratorio donde se muestra que Boyaca es unos de los municipios con mas alto indice de accidentalidad

Contando también que se quería realizar un análisis visual y exploratorio con herramientas como Argis y PowerBI, para así dar una mejor presentación a los datos e interpretarlos de manera adecuada.

localización de fallecidos en siniestros viales en Boyacá

Al realizar el análisis de los datos se encontró en el departamento de Boyacá el total para cada municipio en las cifras totales de fallecidos es de 151, para el periodo enero — septiembre de 2019. Tunja es el municipio que mayor número de fallecidos a nivel departamental (11,3%), seguido de Duitama (7,9%) y Puerto Boyacá (7,9%). Estos municipios junto con Sogamoso (5,3%), Ventaquemada (4%) y Moniquira (4%) representan el 40,4% del total de fallecidos en siniestros viales del departamento.

localización de lesionados en siniestros viales en Boyacá

En cuanto a la participación de cada municipio del departamento las cifras totales para enero y septiembre de 2019 los municipios que más lesionados aportaron al total departamental fueron Tunja (24,68%), seguido por Sogamoso (22,13%) y Duitama (11,78%) en el tercer lugar. En el Mapa se representa geográficamente los lugares donde se presentan los lesionados por cada municipio.

La importancia de uso que tiene la minería de datos permitió extraer información que se encontraba oculta en los reportes de accidentalidad en Colombia; se identificaron patrones que describen las características bajo las cuales más se presentan homicidios y lesionados.

En la actualidad hay libre acceso a los reportes de accidentalidad en Colombia, los datos carecen de detalles en cuanto a la ubicación exacta de la ocurrencia de los hechos, donde a pesar de coincidir los atributos reportados tanto para homicidios como lesionados falta estandarizar en el método de captura de los datos y el mecanismo usado (planilla, formulario). Lo anterior permitiría evitar errores de digitación, ausencia de datos y de esta manera se puede garantizar la fiabilidad de la información.

El conocimiento generado a partir de la aplicación de técnicas de minería puede ayudar a los organismos gubernamentales vinculados al Departamento de Boyacá y de seguridad a tomar decisiones eficaces relacionadas a la implementación de planes de prevención de accidentalidad en el país, para seguir evitando este tipo de sucesos fatídicos y de lesionados.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade