- Si quieres, puedes mirar un fichero con los datos
- Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt
- Sin entrar a programar, puedes cambiar las variables siguientes, situadas al principio, para obtener distintos resultados:
- analisisprevio
- te permite activar o desactivar el análisis de variables. La primera vez debería ser True pero en pruebas sucesivas puedes desactivarlo con False
- parteazar
- te permite marcar la proporción de muestras que se coge enteramente al azar, el resto se cogerá por zonas de valores
- parteajuste
- es para seleccionar la proporción de datos que se usa para el ajuste; el resto se usa para pruebas
- partevalidacion
- indica la proporción de datos que se prueban durante el ajuste para controlarlo, evitando que la red caiga en sobreajuste. Para que puedan funcionar las pruebas, parteajuste+partevalidacion no debe llegar a 1
- modelo
- Puede ser 'lineal', 'lineallineal', 'cuasilineal', 'linealgen' o 'perceptron'
- ocultos
- es el número de unidades en la capa oculta de la red (no se usa para el lineal)
- nolineal
- es la función no lineal que se aplica a la capa oculta. Aquí puedes ver posibilidades (la inicial siempre es mayúscula)
- funcionfinal
- lo mismo pero para la salida final. Valen las mismas opciones. Ten en cuenta que la variables ha sido preprocesada a media 0 y varianza 1 (no te valen funciones solo positivas, ni acotadas en 1)
- velocidad
- marca el avance del método de ajuste en cada paso. Si lo pones grande puedes acabar antes, o puede fallar porque se vuelva inestable. Los valores pequeños son seguros, pero también lentos. Lo ideal es llegar a un compromiso. Redes mayores necesitan valores más pequeños, porque son más inestables.
- analizaresiduos
- te va a mostrar el análisis de los errores de la red, para diagnosticar si ha ido razonablemente bien. Puede que no necesites todas las gráficas, pero mirar alguna sí deberías hacerlo.
- verejemplos
- es para probar a meterle datos a la red y ver qué responde; no solo la respuesta puntual, sino en los alrededores de ese caso, lo cual nos permite ahondar en qué es lo que nos está diciendo
- La primera vez nos detenemos en el análisis de datos. En veces sucesivas, puedes desactivar
analisisprevio
.
- La primera vez usaremos un modelo lineal. Ejecuta y anota los resultados. Los compararemos con los de la red.
- La segunda vez usa el cuasilineal. Prueba cambiando
ocultos
y anota también.
- Y probemos ahora la red. Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
- La tasa de cambio de pesos:
velocidad
- Los parámetros de partición de la muestra: el tanto por uno que se escoge por puro azar (el resto es estratificado por agrupamiento), el tanto por uno que se va a usar para ajuste y el tanto por uno que se va a usar para validación (verificación del ajuste)