1. Si quieres, puedes mirar un fichero con los datos
  2. Vamos a ir preparando modelos. Si sabes hacerlo con Python, a ello. Si no, lo haremos a lo bruto con redes: coge el fichero Pytorch base al que tendrás que quitar la extensión txt y el fichero de configuración que puedes editar
  3. Sin entrar a programar, puedes cambiar las variables siguientes, situadas al principio, para obtener distintos resultados:
    analisisprevio
    te permite activar o desactivar el análisis de variables. La primera vez debería ser true pero en pruebas sucesivas puedes desactivarlo con False
    prueba
    Si vamos a querer conjunto de prueba para el análisis final de rendimiento de la red. Inicialmente será false, hasta que hayamos encontrado las mejores decisiones de diseño. Entonces lo pondremos a true
    parteazar
    te permite marcar la proporción de muestras que se coge enteramente al azar, el resto se cogerá por zonas de valores
    parteajuste
    es para seleccionar la proporción de datos que se usa para el ajuste; el resto se usa para pruebas
    partevalidacion
    indica la proporción de datos que se prueban durante el ajuste para controlarlo, evitando que la red caiga en sobreajuste. Para que puedan funcionar las pruebas, parteajuste+partevalidacion no debe llegar a 1
    modelo
    Puede ser 'lineal', 'lineallineal', 'cuasilineal', 'linealgen' o 'perceptron'
    ocultos
    Si el modelo es una red, es el número de unidades en la capa oculta de la red. Si es 'linealgaen' indica la cola de la distribución (0: Normal, 1: Poisson, entre 1 y 2: Mezcla Poisson-Gamma, 2: Gamma, 3: Gaussiana Inversa, y puede ser mayor). No se usa para el lineal.
    nolineal
    es la función no lineal que se aplica a la capa oculta. Aquí puedes ver posibilidades (la inicial siempre es mayúscula)
    funcionfinal
    lo mismo pero para la salida final. Valen las mismas opciones. Ten en cuenta que la variables ha sido preprocesada a mínimo 0 y máximo 1
    velocidad
    marca el avance del método de ajuste en cada paso. Si lo pones grande puedes acabar antes, o puede fallar porque se vuelva inestable. Los valores pequeños son seguros, pero también lentos. Lo ideal es llegar a un compromiso. Redes mayores necesitan valores más pequeños, porque son más inestables.
    analizaresiduos
    te va a mostrar el análisis de los errores de la red, para diagnosticar si ha ido razonablemente bien. Puede que no necesites todas las gráficas, pero mirar alguna sí deberías hacerlo.
    verejemplos
    es para probar a meterle datos a la red y ver qué responde; no solo la respuesta puntual, sino en los alrededores de ese caso, lo cual nos permite ahondar en qué es lo que nos está diciendo
  4. La primera vez nos detenemos en el análisis de datos. En veces sucesivas, puedes desactivar analisisprevio.
  5. La primera vez usaremos un modelo lineal. Ejecuta y anota los resultados. Los compararemos con los de la red.
  6. La segunda vez usa el cuasilineal. Prueba cambiando ocultos y anota también.
  7. Y probemos ahora la red. Haz pruebas cambiando el número de procesadores ocultos. Si lanzas varias veces el programa sin cambios verás el efecto de la inicialización aleatoria. Otras cosas que puedes tocar:
  8. Cuando hayas seleccionado el mejor diseño, fíjalo y pon prueba a true