340 likes | 586 Views
Introducción a R. Mate 3026 Introducción a la Estadística con Computadoras. Contenido. El lenguaje S Implantaciones de S S-Plus R Características de R Información general sobre R Instalación de R Iniciando y terminando R Obteniendo ayuda Usando R
E N D
Introducción a R Mate 3026 Introducción a la Estadística con Computadoras
Contenido • El lenguaje S • Implantaciones de S • S-Plus • R • Características de R • Información general sobre R • Instalación de R • Iniciando y terminando R • Obteniendoayuda • Usando R • Operacionesmatemáticasbásicas • Funcionesmatemáticas • Variables y asignaciones • Listar el contenido del espacio de trabajo y borrar variables • Vectores • Valoreslógicos y operadoreslógicos • Hojas de Datos (Data Frames) • Lectura de Datos
El lenguaje S • Desarrollado en Bell Laboratories (AT&T) hacia fines de los 70 por Richard Becker, John Chambers y Allan Wilks • Diseñado para ser flexible e interactivo, adecuado para análisis exploratorio de datos. La mayoría de la funcionalidad estadística fue agregada posteriormente. • El desarrollo de S continúa
Implantaciones de S: R • R fue desarrollado inicialmente por Ross Ihaka y Robert Gentleman de la Universidad de Auckland, Nueva Zelanda. • Desde 1995 R es distribuido gratuitamente bajo los términos de la licencia general de GNU. • El desarrollo de R se ha transformado en un esfuerzo de colaboración voluntaria en todo el mundo. • • Desde 1997 un “coregroup”(el cual incluye a John Chambers) administra el desarrollo de R.
Características de R • R es un conjunto integrado de programas para manipulación de datos, cálculos y gráficos. Incluye: • Almacenamiento y manipulación efectivos de datos. • Operadores para realizar cálculos sobre variables con índices (especialmente matrices) • Una colección de herramientas para análisis de datos amplia, coherente e integrada. • Herramientas para análisis gráfico de datos, tanto en pantalla como impreso. • Un lenguaje de programación bien desarrollado, simple y efectivo, el cual incluye condicionales, ciclos, recursión y diversas posibilidades para entrada y salida de datos.
Instalación de R • Se puede obtener programas de instalación para Windows, Mac y varias distribuciones de Linux en http://cran.r-project.org o en alguno de sus “mirrors”. • Para instalar R en Windows, sólo hay que ejecutar el archivo .exe. • Es posible instalar R en otros sistemas operativos compilando las fuentes.
Iniciar y terminarsesión de R • Para iniciar R, haga doble click en el icono en el escritorio, o use el menú “Start” • Para finalizar una sesión de R, escriba > q() • (¡Note que la instrucción para finalizar es una función!) • Aparecerá una ventana con la pregunta : “Saveworkspaceimage?” u tres botones: “Yes”, “No” y “Cancel”. Si se selecciona “No”, los objetos creados durante la sesión serán borrados.
Iniciar R desde RStudio • Luego de instalar R, baje e instale la última versión de R Studio, http://www.rstudio.com/ • Haga doble clic en el ícono de RStudio • Para concluir la sesión use el Menú: File Quit.
Cómoobtenerayuda • Menú “Help” en la barra de menú (R o Rstudio) • Pestaña Help en ambiente Rstudio • Use la instrucción • > help.start() • Ayuda para instrucciones específicas de R puede obtenerse usando > help(command) • Documentación (alguna en español) www.r-project.org . • Otros libros y tutoriales sobre el uso de R: • http://www.cyclismo.org/tutorial/R/ • Introducción a la Programación Estadística con R para Profesores • EstadísticaAplicadausandoR • The R Guide • Buscador en la Web.
Operacionesmatemáticasbásicas • > 7+2*3 [1] 13 • > (7+2)*3[1] 27 • > 12/2+4[1] 10 • > 12/(2+4)[1] 2 • > 3*2^3[1] 24 • Orden de operaciones: paréntesis, exponenciación, multiplicación y división, suma y resta.
Funciones matemáticas • > 2 + 4 * 5 # Orden de operaciones[1] 22 • > log (10) # logaritmo natural de base e = 2.7182[1] 2.302585 • > log10(5) # logaritmo base 10[1] 0.69897 • > 5^2 # 5 al cuadrado[1] 25 • > 5/8 # División[1] 0.625 • > sqrt (16) # RaízCuadrada[1] 4 • > abs (3-7) # Valor absoluto[1] 4 • > pi # 3.14[1] 3.141593
Variables y asignaciones • El resultado de cualquier operación puede ser asignado a una variable usando los operadores “=” o “<-”. • Una variable conservará el valor asignado hasta que sea borrada o el usuario le asigne un valor diferente. • R distingue mayúsculas y • minúsculas : eg, X y x son variables diferentes. • El nombre siempre comienza con una letra. • > x<-5+6^2> x[1] 41 • > y=8+2 > y[1] 10 • > name1="Maria“> name1[1] "Maria"
Listar el contenido del espacio de trabajo y borrar variables • Los objetos almacenados pueden ser vistos usando ls y objects. • Si el resultado de una operación o una función no es almacenado en una variable, dicho valor se perderá. • Las variables pueden ser borradas del espacio de trabajo usando rm • > ls()[1] "name1" "x" "y" "z“ • > objects()[1] "name1" "x" "y" "z“ • > rm(x,y)> ls()[1] "name1" "z"
Vectores Son colecciones ordenadas de objetos (números o caracteres). Los vectores pueden crearse de varias maneras: • Concatenandoobjetos • > x=c(1,2,3,4,5) > x[1] 1 2 3 4 5 • > x=c(x,6)> x[1] 1 2 3 4 5 6 • Creando sucesiones numéricas • Su forma general es seq(inicio, fin, [incremento] • > seq(1,10)[1] 1 2 3 4 5 6 7 8 9 10 • > seq(1960,2000,5)[1] 1960 1965 1970 1975 1980 1985 1990 1995 2000 • > seq(0,1,.1)[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Vectores • Instrucciones reducidas • > seq(10)[1] 1 2 3 4 5 6 7 8 9 10 • > 1:10[1] 1 2 3 4 5 6 7 8 9 10 • Secuencias decrecientes> seq(1,0,-0.1)[1] 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 • > 10:1[1] 10 9 8 7 6 5 4 3 2 1 • Repitepatronesregulares • > rep(1,10)[1] 1 1 1 1 1 1 1 1 1 1 • > rep(1:5,2)[1] 1 2 3 4 5 1 2 3 4 5 • > rep(c("yes","no"),3)[1] "yes" "no" "yes" "no" "yes" "no“ • > rep(1:3,1:3)[1] 1 2 2 3 3 3 • > rep(1:3,length=10)[1] 1 2 3 1 2 3 1 2 3 1
Vectores • Operacionesaritméticas y funcionesmatemáticasaplicadas a vectores se realizancomponente a componente. • > a=1:10> b=a+5 • > b[1] 6 7 8 9 10 11 12 13 14 15 • > a+b[1] 7 9 11 13 15 17 19 21 23 25 • > sqrt(a)[1] 1.000000 1.414214 1.732051 2.000000 2.236068 2.449490[7] 2.645751 2.828427 3.000000 3.162278 • > 10^-a[1] 1e-01 1e-02 1e-03 1e-04 1e-05 1e-06 1e-07 1e-08[9] 1e-09 1e-10
Vectores • Calcule x = sqrt(a+b)/((a-b)*(a+b) • Los corchetes ( [] ) permiten extraer elementos de vectores • > x[3][1] -0.06030227 • > x[10][1] -0.04 • > x[11][1] NA
Vectores (funciones) • Existen muchas funciones específicas para vectores. • length(v) Longitud de un vector • min(v) Valor Mínimo • max(v) Valor Máximo • sum(v) Suma de los componentes • mean(v) Media • var(v) Varianza muestral • sort(v) Ordena valores en forma creciente