1. Empecemos con una red profunda convencional. Coge el fichero que utilizaste la primera vez que vimos este problema y ponle unas cuantas capas ocultas; para ello, entre los corchetes pones, no uno sino varios valores (uno por capa). Pruébalo. Entre las pruebas que hagas asegúrate de probar la combinación de función final Softmax con error CrossEntropy
  2. Sobre esa red prueba:
  3. Probemos una red convolutiva

    Para empezar, aquí tienes un fichero base para empezar a trastear Algunas decisiones se han puesto ya, pero puedes cambiarlo. Otras se han dejado con puntos suspensivos para que las pongas tú. Una capa con ancho de convolución grande puede ser sustituida con ventaja por varias capas de anchos menores, o por una capa con paso mayor (dilation). En este último caso el esquema de definición sería, por ejemplo, '3c5d2' para una capa con 3 procesadores de convolución de ancho 5 y paso 2 Si simplemente quieres cambiar el número de procesadores, sin convolución espacial, basta que pongas ancho 1

    Aparte de todo lo que se te ocurra (en la llamada a ajustar si pones minibatch un poco alto tardará menos, pero el ajuste será mejor si es bajo), haz los siguientes experimentos:

  4. Otros enfoques para poder poner redes grandes y que no se dispare el número de pesos:
    Matrices de pesos simplificadas
    Prueba a poner que las capas tengan matrices de pesos parametrizadas, por ejemplo, mediante una simplificación a ortogonales (enlace a documentación) En una de las convolutivas, ponle o por delante. Esto hace que el tamaño de una matriz m × n pase a m( n+1 ) 2 (podemos pensar en aproximadamente la mitad)

    Prepara y ajusta. en principio a las de más impacto (más pesos) y vete ampliando hasta que veas que la precisión cae significativamente. Donde te quedes, anota otra línea en la tabla de comparación.

    Aplicación de filtros separables
    Sustituye las convoluciones normales por separables. Anteponle a la capa que quieras una s. El cambio es del estilo de, por ejemplo, en vez de aplicar una convolución (5,5), aplicar sucesivamente (5,1) y (1,5). Fíjate que en este ejemplo, hemos pasado de 25 pesos a 10

    Prepara, ajusta primero las capas de más pesos, hasta que veas que la precisión se degrada. Hasta donde llegues, anota otra línea