340 likes | 445 Views
APRENDIENDO A UTILIZAR Y DISEÑAR PROPUESTAS DIDÁCTICAS CON EL PAQUETE ESTADÍSTICO R-PROJECT.
E N D
APRENDIENDO A UTILIZAR Y DISEÑAR PROPUESTAS DIDÁCTICAS CON EL PAQUETE ESTADÍSTICO • R-PROJECT
Unos de los principales desafíos que se le plantea al docente de matemáticas que se desempeña en carreras que no la tienen como principal disciplina, y en particular en las ciencias económicas es desarrollar e implementar propuestas didácticas capaces de generar aprendizajes significativos en los alumnos.
Responder a esta inquietud a conciencia, responsablemente, nos lleva ineludiblemente a plantearnos otra: • ¿Qué es enseñar matemática en una carrera de ciencias económicas? • Porque solo en función de esta respuesta podremos decidir si un aprendizaje es o no “significativo”
Enseñar la disciplina matemática. • Enseñar a utilizar las herramientas que la matemática aporta a la economía. • Enseñar a utilizar las matemáticas como herramienta de la economía. • Enseñar a utilizar las matemáticas como herramienta del economista. • Utilizar las matemáticas como herramienta para que los estudiantes aprendan economía.
Todo curso de matemática tiene un poco de cada una de estas respuestas según el momento y el tema; sin embargo es importante plantearse el: • ¿Para qué? • Previamente para poder resolver el • ¿Cómo se enseña? • y el • ¿Qué se enseña?.
¿Qué enseñar? Es una decisión de índole política, depende de muchos actores y se decide al momento de plantear los programas de una materia y a nivel global planes de carrera (Currículo). • Esto no deja sin grados de libertad al profesor porque diariamente decidimos: • ¿Cómo enseñar? El profesor interpreta el currículo y decide cómo se implementa en su curso.
¿Cómo enseñar? • ¿Qué se gana y qué se pierde con la incorporación de las TIC´s a la clase de matemática y de estadística?: • TICS: Tecnologías de la Información y la Comunicación. • Decidir incorporar las TIC’S a la clase implica introducir un nuevo factor que necesariamente nos obliga a reasignar los recursos.
Recursos: • Tiempo • Cantidad de Estudiantes • Cantidad de Docentes • Relación Docente Estudiante y Estudiante Docente • Relación Estudiante Saber y Docente Saber • Conocimientos Previos de los Estudiantes • Preparación Previa de los Docentes • Planificación de la Clase • Evaluación
Diagnóstico de Situación • Cursos “teóricos”: Donde se hace foco en el aprendizaje de la disciplina matemática/estadística. • Cursos “aplicados”: Por lo general son un compendio de fórmulas, la aplicación de software (en los mejores de los casos) solo enseña a leer la salida de los programas.
R-Projecthttp://www.r-project.org/ • Es un Software de Núcleo Abierto, basado en el lenguaje S. • Es uno de los más poderosos ambientes estadísticos, con más de 1000 paquetes contribuidos. • R es totalmente GRATUITO.
Instalación • www.cran.r-project.org • Download and Install R:hacer clic en Windows.
La línea de comandos empieza con “>”. En estas líneas se escriben las sentencias. • Las sentencias se ejecutan mediante la tecla “Enter”. Si una sentencia no esta completa y la ejecutamos aparecerá un + que indica que falta completar la sentencia comenzada en el renglón anterior. La misma puede completarse a continuación del +. Por ejemplo: • > 4*(3+2 • + )
Para guardar los resultados obtenidos se debe asignar un nombre al resultado, R tiene tres comandos de asignación “<-”, “->“ y “=“. Por ejemplo: a<- 2+2 guarda en “a” el resultado de 2+2 log(23) -> b guarda en “b” el resultado de log(23) d= exp(5*37*0.37) guarda en “d” el resultado de exp(5*37*0.37) • Escribiendo el nombre del objeto se puede ver su contenido: > a [1] 4 > b [1] 3.135494 • R es sensible a mayúsculas y minúsculas, o sea, “a” y “A” son objetos diferentes
El “Help” • Una forma de obtener ayuda es ir a “Ayuda Html” en la consola o corriendo la sentencia: >help.start()
Seleccionando la opción Package se obtendrá ayuda de todos los paquetes instalados en mi sesión de R (o sea, no se obtiene la ayuda de todos los paquetes disponibles sino solo de los que tengo instalados. Si no instalé ninguno todavía, se obtiene la ayuda de los paquetes que trae instalado el software que podemos verlos en nuestra sesión de R haciendo
Si se quiere obtener ayuda sobre alguna de las funciones disponibles se ejecuta la sentencia • > help(nombre de la función) o simplemente > ?nombre de función
Tipos de Datos • R trabaja con diferentes tipos de Datos y Objetos : • Existen 4 tipos de datos: • Numérico, • Carácter, • Complejo y • Lógico. • mode (nombre de objeto) • Tipo de Dato hace referencia a la forma en que R indica a la • Computadora que guarde la información en Memoria.
Objetos • Los Objetos son conjuntos de Datos. • Hacen referencia a la manera en que R organiza los Datos para trabajar con ellos. La siguiente lista no es Exhaustiva.
Paquetes Adicionales • R consta de un “sistema base” y de paquetes adicionales que extienden la funcionalidad. • Distintos “tipos” de paquetes: • los que forman parte del sistema base • los que no forman parte del sistema base, pero son “recommended” (por ejemplo: survival, nlme) • otros paquetes se necesita seleccionarlos e instalarlos individualmente
El paquete seleccionado se instalará en la computadora. Esto debe hacerse una sola vez en su computadora. • Para cargar el paquete en la computadora, tipee por ejemplo: library(xlsReadWrite) • Es necesario cargar el paquete cada vez que se abre una sesión de R. • Otra forma de instalar paquetes es mediante “Instalar paquetes a partir de archivos zip locales”
Leer Datos Externos • R puede leer datos guardados como archivo de texto con las funciones: read.table, scan y read.fwf. • R también puede leer archivos en otros formatos (Excel, SAS, SPSS,…) pero las funciones necesarias no están incluidas en el paquete base. • La función read.table crea un marco de datos (data frame) y constituye la manera más usual de leer datos en forma tabular. Por ejemplo si tenemos un archivo de nombre data.dat, el comando: • > misdatos <- read.table (“C:/data.dat”, header=TRUE) creará un marco de datos denominado misdatos. • header=TRUE es una opción que indica que la primera fila del archivo contiene los nombres de las variables. • “C:/DATA.DAT” es la ubicación y el nombre del archivo. Es importante destacar que se utiliza “/” en lugar de “\” para indicar las carpetas donde se encuentra el archivo. También se puede utilizar “\\”. • En el caso que el delimitador no sea la coma, se puede utilizar: sep=“;” para archivos con columnas delimitadas por punto y coma. • Si el carácter decimal no es un punto sino, por ej., una coma, se puede usar: dec=“,”. • Hay funciones especializadas para otros ficheros ( por ejemplo: read.csv, read.delim) pero son casos específicos de read.table.
Distribuciones de Probabilidad y Números Aleatorios • R puede calcular cuartiles y los valores de distribución acumulada, así como generar números al azar para un gran número de distribuciones. • Permite la especificación de una semilla para el generador de números aleatorios. >rdistribucion(n,a,b) n: cantidad de números aleatorios, a,b: Parámetros >pdistribucion(a) Probabilidad. • Esto es importante para permitir la replicación de los resultados. • Más información sobre las distribuciones de probabilidad de R se puede encontrar en la vista CRAN “Probability Distributions Task View”.
Estadística Descriptiva • En R existen numerosas herramientas de estadística descriptiva: • >mean(d) d es un vector de datos (int o float) • >sd(d) • >summary(d) resumen de descriptivas. • >hist(d) histograma. • >truehist(d6, main="Distribución del coeficiente de variabilidad n=200",xlab="Coeficiente de variabilidad",ylab="Frecuencia relativa") Hay que cargar el paquete “lattice”. Tiene mejores gráfico. • >plot(x,y) diagrama de dispersión.
Propuesta Didáctica: Propiedades de Estimadores “Poco Estudiados” • La estimación muestral del Coeficiente de variación es y sus propiedades son poco conocidas. • El Coeficiente de Variación es muy utilizado. • Las herramientas teóricas para “atacar” el problema son muy complejas para un curso básico. • El problema se simplifica mucho utilizando simulación
Método de Monte Carlo • Montecarlo consiste en asignar a cada una de las variables inciertas un rango de valores gobernado por un modelo probabilístico determinado. Puede resumirse como: • Genero n números pseudoaleatorios con distribución uniforme, en el intervalo [0,1). Por un conocido teorema de probabilidades, se puede interpretar a estos valores como probabilidades acumuladas: • Aplicar la inversa de la función de distribución de la variable aleatoria (x) que interesa simular: • Con los valores obtenidos, calcular estimadores de los momentos de la variable aleatoria. En virtud de la Ley de los grandes números si la cantidad de simulaciones es suficiente, el error entre la simulación y el valor verdadero es despreciable. Esto es: • .
Estrategia de Trabajo • Para analizar las propiedades del Coeficiente de variabilidad a partir del método de Monte Carlo, supondremos cuatro alternativas para la distribución subyacente de los datos: • Distribución Normal (Con un coeficiente de variabilidad del 10%), Distribución Exponencial (Cuyo coeficiente de variabilidad es 100%), • Distribución de Bernoulli (Con un coeficiente de variación del 100%) • Distribución de Poisson (Con un coeficiente de variación del 100%). • En todos los casos se generar 100000 muestras aleatorias de tamaño 4, 10, 20, 50, 100 y 200. Para cada una de las muestras se calcular media y el desvío estándar, definiéndose el coeficiente de variación muestral como el cociente entre estos. • Computar los valores de Media, Sesgo promedio, Desvío, Principales percentiles e histograma de los coeficientes de variación. • Claramente puede aplicarse este método de trabajo a otros estimadores.