Descárgate un fichero con los datos Puedes echarle un vistazo
Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt
Estaría bien graficar las variables, usando matplotlib, o hacer algún otro análisis estadístico de datos. Quizá funciones como éstas te inspiren Si todo el cuadro de gráficos es difícil de ver, puedes ir a sacarlos uno a uno. Aquí tienes un ejemplo Intenta sacar alguna conclusión.
Hasta que no tengas los ajustes definitivos para un modelo, no uses los conjuntos de prueba (tep,tsp), sino que usa para las pruebas los de validación (tev,tsv)
La primera vez usaremos un modelo lineal. Puedes hacerlo aparte con alguna librería estadística, o usar una red en la que has quitado todas las partes no lineales. Ejecuta y anota los resultados. Los compararemos con los de la red.
La segunda vez usa un modelo cuasilineal. Puedes usar paquetes estadísticos, o redes con ramas separadas para cada variable, siguiendo esta idea.
Y probemos ahora la red (donde nn.Sequential). Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
- La función no-lineal usada entre las capas o a la salida.
- La tasa de cambio de pesos o learning rate, lr en la llamada a LBFGS
- Los parámetros de partición de la muestra: el tanto por uno que se escoge por puro azar (el resto es estratificado por agrupamiento), el tanto por uno que se va a usar para ajuste y el tanto por uno que se va a usar para validación (verificación del ajuste)
Puedes analizar estadísticamente los residuos.
Puedes comparar lo obtenido con lo real en algún caso de la muestra.