- Si quieres, puedes mirar un fichero con los datos
- Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt
- La primera vez nos detenemos en el análisis de datos. En veces sucesivas, puedes desactivarlo
- Hasta que no tengas los ajustes definitivos para un modelo, no uses los conjuntos de prueba (
tep,tsp
), sino que usa para las pruebas los de validación (tev,tsv
)
- La primera vez usaremos un modelo lineal. Busca la llamada a
tipored.lineal
. Así usa un ajuste de red lineal. Tienes también la opción lineallineal
que usa regresión lineal normal. Ejecuta y anota los resultados. Los compararemos con los de la red.
- La segunda vez usa el cuasilineal. Con ese nombre, usa redes con ramas separadas para cada variable. Tienes la opción
linealgen
, que usa una regresión Tweedie. En el primer caso puedes jugar con los procesadores ocultos por cada variable. En el segundo puedes jugar con la cola de la distribución (0: Normal, 1: Poisson, entre 1 y 2: Mezcla Poisson-Gamma, 2: Gamma, 3: Gaussiana Inversa, y puede ser mayor). Prueba y anota también los resultados.
- Y probemos ahora la red (
tipored.perceptron
. Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
- La tasa de cambio de pesos o learning rate, en la llamada a
ajuste
- Los parámetros de partición de la muestra: el tanto por uno que se escoge por puro azar (el resto es estratificado por agrupamiento), el tanto por uno que se va a usar para ajuste y el tanto por uno que se va a usar para validación (verificación del ajuste)