- Si quieres, puedes mirar un fichero con los datos
- Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt y el fichero de configuración que puedes editar
- Sin entrar a programar, puedes cambiar las variables siguientes, situadas al principio, para obtener distintos resultados:
- analisisprevio
- te permite activar o desactivar el análisis de variables. La primera vez debería ser true pero en pruebas sucesivas puedes desactivarlo con False
- prueba
- Si vamos a querer conjunto de prueba para el análisis final de rendimiento de la red. Inicialmente será false, hasta que hayamos encontrado las mejores decisiones de diseño. Entonces lo pondremos a true
- parteazar
- te permite marcar la proporción de muestras que se coge enteramente al azar, el resto se cogerá por zonas de valores
- parteajuste
- es para seleccionar la proporción de datos que se usa para el ajuste; el resto se usa para pruebas
- partevalidacion
- indica la proporción de datos que se prueban durante el ajuste para controlarlo, evitando que la red caiga en sobreajuste. Para que puedan funcionar las pruebas, parteajuste+partevalidacion no debe llegar a 1
- modelo
- Puede ser 'lineal', 'lineallineal', 'cuasilineal', 'linealgen' o 'perceptron'
- ocultos
- Si el modelo es una red, es el número de unidades en la capa oculta de la red. Si es 'linealgaen' indica la cola de la distribución (0: Normal, 1: Poisson, entre 1 y 2: Mezcla Poisson-Gamma, 2: Gamma, 3: Gaussiana Inversa, y puede ser mayor). No se usa para el lineal.
- nolineal
- es la función no lineal que se aplica a la capa oculta. Aquí puedes ver posibilidades (la inicial siempre es mayúscula)
- funcionfinal
- lo mismo pero para la salida final. Valen las mismas opciones. Ten en cuenta que la variables ha sido preprocesada a mínimo 0 y máximo 1
- velocidad
- marca el avance del método de ajuste en cada paso. Si lo pones grande puedes acabar antes, o puede fallar porque se vuelva inestable. Los valores pequeños son seguros, pero también lentos. Lo ideal es llegar a un compromiso. Redes mayores necesitan valores más pequeños, porque son más inestables.
- analizaresiduos
- te va a mostrar el análisis de los errores de la red, para diagnosticar si ha ido razonablemente bien. Puede que no necesites todas las gráficas, pero mirar alguna sí deberías hacerlo.
- verejemplos
- es para probar a meterle datos a la red y ver qué responde; no solo la respuesta puntual, sino en los alrededores de ese caso, lo cual nos permite ahondar en qué es lo que nos está diciendo
- La primera vez nos detenemos en el análisis de datos. En veces sucesivas, puedes desactivar
analisisprevio
.
- La primera vez usaremos un modelo lineal. Ejecuta y anota los resultados. Los compararemos con los de la red.
- La segunda vez usa el cuasilineal. Prueba cambiando
ocultos
y anota también.
- Y probemos ahora la red. Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
- La tasa de cambio de pesos:
velocidad
- Los parámetros de partición de la muestra: el tanto por uno que se escoge por puro azar (el resto es estratificado por agrupamiento), el tanto por uno que se va a usar para ajuste y el tanto por uno que se va a usar para validación (verificación del ajuste)
- Cuando hayas seleccionado el mejor diseño, fíjalo y pon prueba a true