Buscamos conocimiento en general
Agrupamiento
- Métodos: puedes hacerlo a ojo, o con algoritmos; en este caso, para el número de grupos, o procedes por pruebas midiendo calidad (ver abajo) o utilizas uno aglomerativo y cortas en el momento en que se unen grupos más disimilares
- Ejemplos:
- Medidas de calidad:
- A ojo: error de cuantización (la distancia media entre cada punto y su grupo idealmente debería ser baja) y la separación entre grupos debe ser clara
- Con algoritmos
Asociación
Cosas que van juntas.
- Cobertura
- número de casos que cumplen esa regla (o esa asociación), expresada como porcentaje del total de casos
existentes.
- Confianza
- fracción o porcentaje en que si se cumple el antecedente se cumple el consecuente, es decir, porcentaje de casos en que, dándose el antecedente, se da el consecuente
Ejemplo
Buscamos conocimiento sobre algo
Una primera cuestión es qué variables son relevantes para ese algo. Ensayamos selección de variables basada en árboles.
Discreto: clasificación
- Ejemplo de reglas También puedes programarlo
- Ejemplo de predicados
Probamos también una regresión logística
Continuo o discreto
Modelos basados en memoria
Ideas
Ejemplos
Modelos de regresión
Ideas
Reflexiones
Ensayamos una regresión con ponderación automática (Regresión ARD), una lineal generalizada y un perceptrón. Cuestiones a comprobar:
- Los valores que tenemos no nos están dando sesgo. Cuidado con los valores excepcionales. Podemos remuestrear y comprobar.
- La forma del modelo es correcta: los errores deberan tener media nula, varianza constante, independientes unos de otros, no tener una forma marcada ni seguir una tendencia. Su distribución será una aleatoria
- La cantidad de puntos de muestra es mucho mayor que el número de coeficientes. O hemos tomado medidas al respecto.