En el marco de un análisis sobre la salud de los nuevos estudiantes de la UC, extraeremos una muestra consistente en 1000 alumnos a los que se somete a una encuesta compuesta de las siguientes variables:
Crea un dataframe denominado muestra, compuesto de 1000 casos.
Establecemos la semilla para que el resto del ejercicio pueda ser reproducido como en el aula
VARIABLE CUANTITATIVA CONTINUA.
VARIABLE NUMÉRICA DISCRETA.
VARIABLE CUALITATIVA NOMINAL.
VARIABLE CUANTITATIVA DISCRETA.
VARIABLE CUALITATIVA NOMINAL.
Conversión de los vectores en un único dataframe
Eliminar los vectores originales
Transforma en factores aquellas variables que consideres necesario.
¿Cúal son los valores correspondientes a?:
Filas 12 a 14
Columnas 21 a 30
Filas 17 a 21 de la variable grupo_sanguineo
Crea una nueva variable denominada IMC que resulta de dividir el peso (en kg) entre la estatura en metros elevada al cuadrado.
Recodifica la variable IMC creando una nueva variable, denominada “riesgo_sobrepeso”, que tendrá las siguientes categorías:
Convierte en factores las variables 6 y 7.
Variable 6: tomará como nuevo nombre rama_conocimiento. Transforma esa variable en factor con las siguientes categorías y etiquetas; 1 Arte y Humanidades, 2, Ciencias, 3 Ciencias Sociales y Jurídicas, 4 Ingeniería y Arquitectura, 5 Ciencias de la Salud.
Variable 7: tomará como nuevo nombre uso_movil. Transforma esa variable en factor con las siguientes categorías y etiquetas; 1 Menos de 2 horas diarias, 2 Entre 2 y 5 horas diarias, 3 Más de 5 horas diarias.
Comprueba si hay datos nulos en el dataframe, y en su caso, elimínalos.
Crea un nuevo dataframe, denominado sobrepeso_masculino, que contenga todos los hombres con sobrepeso y obesidad.
De este último dataframe, elimina las variables peso, altura, y uso de móvil.
Graba este dataframe con formato .rds en el directorio de trabajo donde alojarás los materiales del curso.
Graba todo el contenido del Global Environment con formato .RData.