220 likes | 777 Views
R 을 이용한 통계분석. 소속 / 작성자. 이 문서는 나눔글꼴로 작성되었습니다 . 설치하기. 목차. 데이터 불러오기 데이터 분석하기. 1. 데이터 불러오기. 데이터 입력에는 두가지 정도 방법이 있다. 직접입력하 기 - 앞서 배운 data.frame 또는 matrix 를 통해 입력 - 직접 입력하는 방법은 소규모 자료 분석시 이용. 파일을 통해 불러오기 - read.csv 또는 read.table 을 통해 불러오기. 1. 데이터 불러오기.
E N D
R을 이용한 통계분석 소속 / 작성자 이 문서는 나눔글꼴로 작성되었습니다. 설치하기
목차 데이터 불러오기 데이터 분석하기
1. 데이터 불러오기 데이터 입력에는 두가지 정도 방법이 있다 직접입력하기 - 앞서 배운 data.frame또는 matrix를 통해 입력 - 직접 입력하는 방법은 소규모 자료 분석시 이용 파일을 통해 불러오기 - read.csv 또는 read.table을 통해 불러오기
1. 데이터 불러오기 지정된 디렉토리 에서 가지고 오기 -getwd() -파일은 지정된 디렉토리에서 불러와야 함 ※setwd(“경로”)를 통해 변경 가능
1. 데이터 불러오기 파일을 통해 불러오기 -read.csv(“파일명.csv”)- 지정된 디렉토리에 파일이 있을경우 -read.csv(“경로/파일명.csv”)-지정된 디렉토리에 파일이 없는경우 Txt파일일 경우 -read.table(“파일명.txt”) 로 불러옴 Tip! Help(명령어) 시 명령어에 따른 다양한 옵션을 볼수있음
1. 데이터 불러오기 Help(read.csv) - 명령어 옵션 변수, 변수설명, 사용예제 등을 확인할수 있음
2. 데이터 분석하기 - 분석하고자 하는 변수가 연속형인가? 범주형인가?
2. 데이터 분석하기 - 연속형 자료 요약통계량으로 최대값,최소값,평균,분산,표준편차를 계산 - 범주형 자료 요약통계량으로 백분율 등을 계산 - 분석하고자 하는 데이터가 어떤 형인가에 따라 분석기법은 달라짐
2. 데이터 분석하기 - summary() • 최소값 • 1분위수 • 중앙값 • 평균 • 3분위수 • 최대값
2. 데이터 분석하기 - 표본수length() - 평균 mean() - 분산 VAR() - 얼마나 모집단을 대표하는가? - 표준편차 sd()
2. 데이터 분석하기 - 표준오차 sd()/sqrt(legnth()) - 표본을 신뢰할수 있는가? - 사분위수 fivenum()
2. 데이터 분석하기 - Boxplotboxplot() max 3Q median 1Q min 윗값은 boxplot(1:31) 의 값임
2. 데이터 분석하기 - 히스토그램 • hist(a$PLT,probability=TRUE) • Lines(density(a$PLT))
2. 데이터 분석하기 - 줄기 잎그림 - stem(a$PLT)
2. 데이터 분석하기 - Q-Q Normality plot • qqnorm(a$PLT) • qqline(a$PLT)