Grandes problemas, grandes redes

Imágenes

1 Problema a resolver

Volvemos a plantearnos el reconocimiento de dígitos manuscritos. Nos van a dar una serie de imágenes de dígitos manuscritos y tenemos que decir en cada caso cuál es.

1 Detalles técnicos

Las imágenes vienen en 28x28 píxels en blanco y negro. No es gigantesco, pero cada una son 784 valores.

Para ajuste y validación hay 60000 imágenes. Para prueba hay otras 10000.

2 Márgenes de precisión en que nos movemos

Modelo idiota: decir siempre el mismo número. Tasa de error: 90%
Modelo simple: regresión lineal. Tasa de error: 15%
Modelo fantástico: Tasa de error: 0.2% (personas y redes neuronales)

3 Decisiones a tomar

¿Qué variables cogemos? ¿Cuántos casos? Los casos, los que necesitemos y los que podamos cargar; podemos hacer pruebas. Las variables:
1. Los píxels directamente (784 por caso) Esto es lo que haremos nosotras.
2. Hacemos una selección de variables específica de imágenes (si sabes de proceso de imágenes)
¿Qué tipo de red? ¿con qué arquitectura? Pequeño, pocas capas pero muchos procesadores, muchas capas, ...
Si es un perceptrón grande, ¿cómo lo vamos a controlar? Lo que vimos en la práctica de redes profundas, edes recursivas, pesos parametrizados, ...

Y tu opción de trabajo:

Jose Luis Crespo