MACHINE LEARNING APLICADO A LA COMPACTACIÓN DE SUELOS
1. Introducción
El suelo es un material compuesto por una parte sólida, líquida y gaseosa, que se formó durante cientos de millones de años de meteorización y sedimentación.
La compactación consiste en eliminar la mayor cantidad de masa gaseosa (comúnmente aire) del suelo mediante carga que puede estar
La curva de compactación consiste en una curva que se construye después de marcar los puntos pares de densidad seca y la humedad de la muestra. Con un mínimo de 5 puntos se traza a mano una curva que pueda correlacionar todos estos puntos y se obtienen la densidad seca máxima y la humedad óptima a la que se puede compactar este suelo.
Estos parámetros son linealmente independientes y no existe una relación entre el ensayo de compactación y la clasificación de suelos, por lo que se realizan dos ensayos diferentes para la obtención del mismo.
2. Descripción del problema
Para cada kilómetro de carretera se requieren 5 pozos de ensayo de los cuales es requisito presentar dos ensayos:
- Clasificación de suelos
- Compactación
En la práctica, debido a los recursos económicos y la logística que representa solo se realizan 5 ensayos de clasificación y 2 de compactación y los resultados se interpolan.
3. Objetivo
Determinar una correlación entre la clasificación de suelos y la compactación de suelos, refiriéndose al valor de densidad seca máxima y humedad óptima, para calcular la humedad a la que se compactará un determinado tramo de carretera.
4. Selección del modelo
Debido a que se conoce el resultado y el problema es numérico, los modelos que se usaron fueron:
- Regresión lineal
- Regresión multi-lineal
- Regresión polinómica
5. Técnicas implementadas
5.1 Reducción de dimensiones
Se redujeron todas las columnas que no aportan una información relevante: ‘Pozo’, ‘Lado’, ‘Prf o (m)’, ‘Prf f (m)’, ‘% Hum’, ‘ST >3’, ‘3’, ‘AASTHO’, ‘#’, ‘SUCS’, ‘100%’, ‘97%’, ‘95%’, ‘100%.1’, ‘97%.1’, ‘95%.1’
5.2 Valores faltantes
En la columna de LL se encontró que faltaban 30 datos, se utilizó un histograma y se determinó que la curva normal que describe a sus datos estaba desfasada del medio, por lo que se rellenó los datos faltantes con la mediana, que es 32.2
5.3 Gráficas
Se realizaron todas las gráficas necesarias para entender e interpretar el problema.
Relación lineal (con sklearn)
Relación polinómica de 2do grado (con numpy)
Relación polinómica de 3er grado (con numpy)
Relación multi-lineal (con sklearn)
Relación multi-lineal (con sns) donde se relacionan los 14 parámetros entre sí y su relación con la Humedad óptima.
6. Evaluación del modelo
6.1 D max vs H opt
Regresión lineal:
Regresión polinómica de 2do grado:
Regresión polinómica de 3er grado:
6.2 Feature vs H opt
Regresión lineal:
7. Análisis de resultados
7.1 D max vs H opt
Se puede observar que es la regresión polinómica la que tiene un coeficiente de correlación más cercano a 1 y en gráfica la que mejor se ajusta por lo que será la regresión adoptada
7.2 Feature vs H opt
Se puede observar un valor de coeficiente de correlación cercano a 1 y en las gráficas de sns la gran mayoría son relaciones lineales por lo que se acepta el modelo multi-lineal conseguido.
8. Conclusión
Se determinó una correlación entre la clasificación de suelos y la compactación de suelos, para calcular la humedad a la que se compactará un determinado tramo de carretera:
H opt = 0.117*(LL) + 0.0212*(LP) — 0.007*(2) + 0.010*(1 ½) — 0.004*(1) — 0.001*(¾) + 0.017*(⅜) — 0.001*(no 4) — 0.052*(no 10) +
+ 0.054*(no 40) + 0.036*(no 200) — 0.043*(% Grava) + 0.007*(% Arena) + 0.036*(% Finos) + 3.779
D max = 4.110*10^(-4)*(H opt)² — 4.256*10^(-2)*(H opt) + 2.394