Proyecto de Innovación Convocatoria 2019/2020 Nº de proyecto: 343 Título del proyecto: Tutoriales guiados de prácticas en “Estadística: Análisis de Datos e Inferencia” mediante el software libre SAS University Edition Nombre del responsable del proyecto: Nirian Martín Apaolaza Centros: Facultad de Comercio y Turismo, Facultad de Ciencias Matemáticas Departamentos: Departamento de Economía Financiera y Actuarial y Estadística, Departamento de Estadística e Investigación Operativa, Departamento de Álgebra, Geometría y Topología Contenido 1. Objetivos propuestos en la presentación del proyecto ........................................... 3 2. Objetivos alcanzados ............................................................................................. 4 3. Metodología empleada en el proyecto ................................................................... 6 4. Recursos humanos ................................................................................................ 7 5. Desarrollo de las actividades ................................................................................. 8 6. Anexo .................................................................................................................... 9 6.1. Encuestas ......................................................................................................... 9 6.2. Tutoriales guiados ............................................................................................ 10 1. Objetivos propuestos en la presentación del proyecto El objetivo principal de este proyecto era el de la elaboración de material docente para las asignaturas con contenido de Inferencia Estadística y Análisis de Datos, de las Facultades de Ciencias Matemáticas y de Ciencias Económicas y Empresariales; como, por ejemplo, la asignatura de Análisis de Datos que se imparte en la Facultad de Ciencias Matemáticas, en el tercer curso del grado de Matemáticas y Estadística. En concreto, se pretendía la elaboración de un manual para aprender a utilizar el software estadístico SAS Studio. Si bien SAS es un potente programa de pago, ofrece una versión gratuita (orientada principalmente a los estudiantes) denominada SAS University. SAS University es un software libre o de uso no comercial, que facilita al alumnado la fácil accesibilidad al programa desde cualquier ordenador. La propuesta consistía en elaborar material docente mediante Jupiter Notebooks, una herramienta que permite incluir código de forma interactiva, resultados del código y elementos de texto descriptivos. Esta herramienta no es exclusiva de SAS University, de hecho, inicialmente estaba pensada para código en R y se ha ido adaptando a muchos otros lenguajes de programación, siendo mucho menos extendido, de momento, su uso para el aprendizaje de SAS. Así pues, los objetivos principales eran que: 1. El alumnado y el profesorado trabajen en un entorno atractivo, como suelen ser los programas a través de paneles como SPSS. 2. El alumnado refuerce sus nuevos conocimientos en Estadística. 3. El alumnado y el profesorado no perciban los comandos del software como una complicación añadida a la propia asignatura. 2. Objetivos alcanzados Pese a la clara necesidad en las grandes empresas del uso de Software estadístico (que se puede comprobar en la descripción de la mayoría de las prácticas ofertadas) la mayoría de los alumnos de la Facultad de Ciencias Matemáticas carecen de formación en el uso de software estadístico. En particular, no hay ninguna asignatura obligatoria en el grado de Matemáticas cuyo plan de estudios prevea su aprendizaje; y en los grados de Matemáticas-Estadística y doble grado de Economía y Matemáticas- Estadística, el uso de software estadístico no se imparte hasta tercer y cuarto curso, respectivamente. Se consideró pues, que el primer paso era el detectar de forma detallada las carencias de los alumnos y su conocimiento de SAS, así como la percepción que tenían de éste. Así pues, se realizó una encuesta a los alumnos de la asignatura Análisis de Datos, del tercer curso del grado Matemáticas-Estadística de la Facultad de CC. Matemáticas. La encuesta se realizó por medio del Campus Virtual de la asignatura. Mostramos las respuestas de la encuesta a dos de las preguntas clave. Efectivamente, como se puede observar en el gráfico de la izquierda, los alumnos encuestados no tienen en general conocimientos sobre SAS. Por otro lado, más de la mitad de los alumnos encuestados consideran que se debería recibir más información en el grado. Además, a la pregunta “En caso de seguir un manual, ¿prefieres que sea ¿Tienes conocimientos de SAS? Si, lo he estudiado en el Grado Si, pero no lo he estudiado en el Grado No, no tengo ¿Crees que se debería recibir más formación de SAS en el Grado? NS/NC No Si interactivo?”, dos de cada tres alumnos contestan afirmativamente. Todas las preguntas y resultados de la encuesta se pueden consultar en la Sección 6. Parecía claro la necesidad de cubrir esta carencia. Para ello se desarrolló un pequeño manual de análisis de datos con SAS Studio mediante la herramienta Jupiter Lab. Este manual, que se seguirá desarrollando, se centra inicialmente en los siguientes aspectos. 1. Introducción a SAS y Creación de Librerías en SAS: se aporta una pequeña introducción que pretende no ser demasiado técnica pero sí útil. 2. Importación de los Datos: es importante tener en cuenta que para su mayor aplicabilidad los alumnos deben saber trabajar con todo tipo de ficheros de datos, no sólo datos SAS. En este caso, se enseña a importar datos Excel, siendo extensible a cualquier tipo de archivo. 3. Tratamiento de datos Missing: se dan algunas directrices para la detección, corrección e imputación de datos missing. 4. Análisis descriptivo de los datos: herramientas básicas para el análisis tabular y gráfico de datos univariantes y multivariantes. Todo esto se ha hecho en base a el conjunto de datos creado por Gregory Lee para su libro "Business Statistics Made Easy in SAS", disponible para usuarios SAS en la plataforma SASSuport y que representa de manera muy realista una compañía ficticia dedicada a la creación y mantenimiento de un software de contabilidad. El material docente elaborado se ha realizado en castellano. En las secciones 3, 5 y 6, se detallará con más precisión el trabajo realizado en esta herramienta. Si bien se pretende seguir ampliando el material, entendemos que el material está listo para su uso en cualquiera de las asignaturas con contenido de Inferencia Estadística y/o Análisis de Datos. Así, los objetivos logrados se podrían resumir en los siguientes puntos • Detectar las carencias del alumnado en el uso del Software Estadístico SAS. • Crear material práctico e innovador que facilite el aprendizaje de SAS, creando ejemplos prácticos, mediante JupiterLab, y que se pueda enseñar en las asignaturas de Estadística y Análisis de Datos. En el Anexo 6 se presenta el manual realizado, el cuál puede encontrarse, junto con el resto de material necesario para su ejecución en el siguiente enlace https://sites.google.com/view/elenacastillagonzlez/home/research/research-projects https://sites.google.com/view/elenacastillagonzlez/home/research/research-projects 3. Metodología empleada en el proyecto Para alcanzar los objetivos descritos en las Secciones 1 y 2 se llevaron a cabo las siguientes actuaciones: 1. Primera Fase. Detección de las necesidades específicas de aprendizaje en los alumnos. Para ello se llevó a cabo la encuesta comentada en la Sección 6. 2. Segunda Fase. Diseño del curso de “JupyterLab”. Se tuvieron en cuenta las conclusiones obtenidas en la primera fase, y se tomaron decisiones como: • Idioma del curso. Se decidió castellano dado que la docencia en las asignaturas de Estadística de la UCM se imparte principalmente en este idioma. • Contenidos a introducir. Como una primera aproximación, se tratan los temas más básicos: lectura de datos, tratamiento de datos missing y análisis descriptivo de los datos. • Dificultad y estructura de los ejemplos. Se concluyó que no era necesario para el aprendizaje que los ejemplos tuvieran una dificultad excesivamente elevada. En cambio, era necesario que fuesen muy ilustrativos. Por ello, se eligió un conjunto de datos aplicado a la empresa y bastante realista. 3. Tercera Fase. Programación del manual de SAS en “JupyterLab”. Queda pendiente la Cuarta Fase, que sería la implementación del curso programado en asignaturas de los diferentes grados donde los miembros del proyecto dan docencia. Se pretende comenzar al comienzo del curso 2020/2021.Las fases citadas se han desarrollado mediante reuniones de los profesores participantes y trabajo personal de cada uno de los miembros. FASE 1 SAS: DETECCIÓN DE LAS NECESIDADES ESPECIFICAS DE APRENDIZAJE FASE 2 DISEÑO DEl CURSO: IDIOMA CONTENIDOS Y DIFICULTAD FASE 3 IMPLEMENTACION DEL CURSO FASE 4 APLICACIÓN EN EL AULA Figura 1: Esquema representativo de las fases seguidas en la realización del proyecto. 4. Recursos humanos El presente proyecto, propuesto y coordinado por la Facultad de Comercio y Turismo, se trata de un proyecto interfacultativo e interdepartamental. En particular los centros y departamentos implicados son • Facultad de Ciencias Matemáticas (Departamento de Estadística e Investigación Operativa y Departamento de Álgebra, Geometría y Topología); • Facultad de Ciencias Económicas y Empresariales (Departamento de Economía Financiera y Actuarial y Estadística). Descripción de cargo y facultado a la que pertenecen los miembros del proyecto: 1. Nirian Martín Apaolaza. Profesora Titular del Departamento de Economía Financiera y Actuarial y Estadística (responsable del proyecto). 2. Elena María Castilla González. Contratada predoctoral FPU del Departamento de Estadística e Investigación Operativa. 3. Pedro José Chocano Feito. Contratado predoctoral FPI del Departamento de Álgebra, Geometría y Topología. 4. María Jaenada Malagón. Estudiante del máster TECI y becaria de colaboración, del Departamento de Estadística e Investigación Operativa. 5. Leandro Pardo Llorente. Profesor Catedrático del Departamento de Estadística e Investigación Operativa. Los miembros PDI del proyecto tienen una amplia experiencia en la docencia de asignaturas con contenidos de Análisis de Datos e Inferencia Estadística en los grados de Matemáticas, Ingeniería Matemática, Matemáticas y Estadística y doble grado de Economía y Matemáticas y Estadística, todos ellos en la Facultad de Ciencias Matemáticas; así como en el grado de Comercio y Turismo. De hecho, varios de los miembros del equipo de trabajo formaron anteriormente parte de otro Proyecto de Innovación Docente: “Tutorial interactivo de ejemplos básicos y ejercicios de Inferencia Estadística No-paramétrica mediante software libre: implementación mediante R, R-studio y Swirl” (curso 2018/2019). 5. Desarrollo de las actividades En primer lugar, es necesaria la instalación de SAS University Edition. Esto se hará a través de la página web habilitada por SAS. https://www.sas.com/en_us/software/university-edition/download-software.html • Elegir sistema operativo del usuario: este software está adaptado para Windows, Mac y Linux. Una vez elegido el sistema operativo correspondiente, SAS nos instará a asegurarnos de que tenemos una de las últimas versiones y un navegador de internet adecuado (los clásicos, Firefox y Google Chrome son compatibles). • Seguir los siguientes cuatro pasos 1. Creación de una máquina virtual correctamente configurada: quizás el paso más difícil, es recomendable seguir todas las instrucciones detalladas en la citada página web. 2. Descarga de SAS University Edition 3. Configuración del Software en la máquina virtual 4. Uso del Software Una vez realizado el proceso de instalación, ya se puede empezar a utilizar las herramientas de SAS Studio y Jupyter Lab. Se recomienda explicar este proceso en clase, ya que puede resultar un poco complicado para aquellos alumnos con pocos conocimientos informáticos. Figura 2: Instalación de SAS University Estudio. Fuente https://www.sas.com/en_us/software/university- edition/download-software.html https://www.sas.com/en_us/software/university-edition/download-software.html https://www.sas.com/en_us/software/university-edition/download-software.html https://www.sas.com/en_us/software/university-edition/download-software.html 6. Anexo 6.1. Encuestas 6.2. Tutoriales guiados 1. Objetivos propuestos en la presentación del proyecto 2. Objetivos alcanzados 3. Metodología empleada en el proyecto 4. Recursos humanos 5. Desarrollo de las actividades 6. Anexo 6.1. Encuestas 6.2. Tutoriales guiados