1. Primero vamos a jugar con el ajuste/aprendizaje de la red.

    Descárgate el fichero base, nuevamente para el problema de los precios de las casas. Aparte de lo de otras veces, prueba a tocar:

  2. Ahora vamos a tratar de estimar el error en generalización.

    Ya sabemos que medimos la eficiencia del modelo por el error de predicción. Pero, en primer lugar, no debemos medirlo sobre la muestra de ajuste, sino sobre un conjunto más general. En segundo lugar, una sola estimación seguramente no es suficiente. Por ello vamos a obtener varias estimaciones. Estimamos varias veces y obtenemos finalmente el histograma de medidas de error en las distintas pruebas. Los métodos que vienen a continuación se diferencian en cómo se elige los conjuntos de puntos de ajuste dentro de la muestra completa de la que disponemos. En todos vas a tener que ajustar repetidamente.

  3. Un inconveniente de dividir en ajuste, validación y prueba es que perdemos puntos para el ajuste. Una forma de evitar esto es usar el método de remuestreo para controlar el ajuste. La idea es hacer varias pruebas de las anteriores y luego usar esa información en el ajuste en la red definitiva. Para hacer esto, elige una función para estimar el límite de ajuste a partir de las pruebas anteriores: median, mean, geometric_mean o harmonic_mean y luego activa ese reajuste final. Al final ¿con qué te quedas?