Si quieres, puedes mirar un fichero con los datos
Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt
La primera vez nos detenemos en el análisis de datos. En veces sucesivas, puedes desactivarlo
Hasta que no tengas los ajustes definitivos para un modelo, no uses los conjuntos de prueba (tep,tsp), sino que usa para las pruebas los de validación (tev,tsv)
La primera vez usaremos un modelo lineal. Busca la llamada a tipored.lineal. Así usa un ajuste de red lineal. Tienes también la opción lineallineal que usa regresión lineal normal. Ejecuta y anota los resultados. Los compararemos con los de la red.
La segunda vez usa el cuasilineal. Con ese nombre, usa redes con ramas separadas para cada variable. Tienes la opción linealgen, que usa una regresión Tweedie. En el primer caso puedes jugar con los procesadores ocultos por cada variable. En el segundo puedes jugar con la cola de la distribución (0: Normal, 1: Poisson, entre 1 y 2: Mezcla Poisson-Gamma, 2: Gamma, 3: Gaussiana Inversa, y puede ser mayor). Prueba y anota también los resultados.
Y probemos ahora la red (tipored.perceptron. Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
- La tasa de cambio de pesos o learning rate, en la llamada a ajuste
- Los parámetros de partición de la muestra: el tanto por uno que se escoge por puro azar (el resto es estratificado por agrupamiento), el tanto por uno que se va a usar para ajuste y el tanto por uno que se va a usar para validación (verificación del ajuste)