Grandes problemas, grandes redes
Volvemos a plantearnos el reconocimiento
de dígitos manuscritos. Nos van a dar una serie de imágenes de dígitos
manuscritos y tenemos que decir en cada caso cuál es.
Las imágenes vienen en 28x28 píxels en blanco y negro. No es gigantesco,
pero cada una son 784 valores.
Para ajuste y validación hay 60000 imágenes. Para prueba hay otras
10000.
- Modelo idiota: decir siempre el mismo número. Tasa de error: 90%
- Modelo simple: regresión lineal. Tasa de error: 15%
- Modelo fantástico: Tasa de error: 0.2% (personas
y redes neuronales)
- ¿Qué variables cogemos? ¿Cuántos casos? Los casos, los que necesitemos
y los que podamos cargar; podemos hacer pruebas. Las variables:
- Los píxels directamente (784 por caso) Esto es lo que haremos nosotras.
- Hacemos una selección de variables específica de imágenes (si sabes de proceso de imágenes)
- ¿Qué tipo de red? ¿con qué arquitectura? Pequeño, pocas capas
pero muchos procesadores, muchas capas, ...
- Si es un perceptrón grande, ¿cómo lo vamos a controlar? Lo que vimos
en la práctica de redes profundas, edes recursivas, pesos parametrizados, ...
Guión
Jose Luis Crespo