1 / 18

R básico para Data Mining

R básico para Data Mining. Diego Cesar F. de Queiroz - dcfq. Introdução ao R. R é um linguagem (ambiente) de programação para computação estatística e gráfica Baseada na linguagem S (S-Plus) O ambiente R é flexível Pode ser estendido através de pacotes Open source e gratuito.

lorene
Download Presentation

R básico para Data Mining

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. R básico para Data Mining Diego Cesar F. de Queiroz - dcfq

  2. Introdução ao R • R é um linguagem (ambiente) de programação para computação estatística e gráfica • Baseada na linguagem S (S-Plus) • O ambiente R é flexível • Pode ser estendido através de pacotes • Open source e gratuito

  3. Introdução ao R • Homepagedo projeto • http://cran.r-project.org/ • O R é atualizado pelo menos a cada 6 meses • R version 2.9.0 has been released on 2009-04-17. • Usarhttp://www.rseek.org/aoinvés do googleparabuscarcoisasrelacionadasao R.

  4. Observações • Dados são armazenados no “R” como um vetor • a=4 • a[1] • O índice da primeira posição do vetor é sempre 1 • Comentários devem ser precedidos por ‘#’ • A função c() serve para concatenar em forma vetorial. • vetor <- c(1,2,3,4,5,6)

  5. Observações • Para sair • >q () • Para obter ajuda sobre um comando • >help (<nome do comando>) • Se não sabe o nome do comando completo • >help.search (“<parte do comando>”) • >apropos(“parte do nome do comando”)

  6. Entrada e Saída – read.table • O comando setwd ajusta o diretório de trabalho • setwd(“c:/temp”) • Para ler arquivos com nomes de colunas na primeira linha, use • variavel <- read.table (“filename.ext”, header=TRUE) • Para obter os vetores de cada coluna rotulada • variavel$nomedacoluna

  7. Entrada e Saída – scan • O comando setwd ajusta o diretório de trabalho • setwd(“c:/temp”) • Para ler arquivos com nomes de colunas na primeira linha, use • variavel <- scan (“datafile2.dat”, what=list (x=0,y=0)) • Para obter os vetores de cada coluna rotulada • variavel$x • variavel$y

  8. Entrada e Saída – read.csv • Para ler arquivos separados por vírgula ou ponto e vírgula, use • variavel <- read.csv(“filename.csv", sep=";", dec=",",header=FALSE) • Para obterosvetores • variavel$x • variavel$y

  9. Entrada e saída – edit() • Por fim, para digitar os dados em formato de tabela pode-se utilizar o comando edit() • variavel <- edit(data.frame())

  10. Entrada e Saída write.table() e write.csv() • Para salvar um objeto do R podemos utilizar o write.table ou write.csv • write.table(objectname, file =“filename.ext”, sep=“,”) • write.csv(objectname, file =“filename.ext”)

  11. Matrizes • Para definir um conjunto de números como uma matriz utilizamos a função matrix: • m <- matrix(c(1,2,3,11,12,13), nrow = 2, ncol=3, byrow=TRUE)

  12. Operações matemáticas • entre matrizes e números: • se x é uma matriz, temos: • soma: x + 2 • subtração: x - 2 • produto: x * 2 • divisão: x / 2 • potência: x ^ 2 • divisão inteira: x % / % 2 • mod: x %% 2

  13. Operações matemáticas • entre matrizes: • se x e y são matrizes, temos: • soma: x + y • subtração: x - y • produto: x %*% y

  14. Operadores lógicos • maior que: > , >= • menor que: < , <= • igual a: == • diferente de: != • para expressões: • and: & • or: | • not: !

  15. Algumas funções úteis • min() • max() • sum() • mean() • median() • sd() • cor() • var() • cov() • hist() • cbind() • rbind()

  16. Funções de plotagem – plot() • A função plot é a função padrão de desenho no R, todas as outras funções de desenho a utilizam como base • plot(c(1:9),c(1:9), xlab=“Eixo x”, ylab=“Eixo y”) • Existem algumas variações utilizando o parâmetro ‘type’, ex: type=‘l’

  17. Funções de plotagem – boxplot() • A função boxplot cria boxplot de tipos variados, ela pode ser utilizada de maneira singular: • boxplot(c(1:9)) • Pode-se também desenhar vários boxplots simultaneamente com • boxplot(c(1:9),(c(1:9)/10))

  18. R básico para Data Mining Diego Cesar F. de Queiroz - dcfq

More Related