160 likes | 394 Views
보스턴 주택자료 분석. 200711475 허원선 200711476 홍창현. ConTENTS. 1. 프로젝트 개요. 2. 원시 데이터 파일 분석. 3. 기본적 통계분석. 4. 연관성 규칙 분석. 5. 결과 해석. 6. 결 론. 1. 프로젝트 개요. 제안동기 부동산 관련 데이터를 토대로 데이터마이닝을 수행하여 데이터간의 연관관계를 밝혀내고 , 그 결과를 부동산 마케팅 자료료 활용할 수 있게 함 데이터의 형태에 따른 적절한 데이터마이닝 기법을 적용해보고 , 결과값을 검증함
E N D
보스턴 주택자료 분석 200711475 허원선 200711476 홍창현
ConTENTS 1. 프로젝트 개요 2. 원시 데이터 파일 분석 3. 기본적 통계분석 4. 연관성 규칙 분석 5. 결과 해석 6. 결 론
1. 프로젝트 개요 제안동기 부동산 관련 데이터를 토대로 데이터마이닝을 수행하여 데이터간의 연관관계를 밝혀내고, 그 결과를 부동산 마케팅 자료료 활용할 수 있게 함 데이터의 형태에 따른 적절한 데이터마이닝 기법을 적용해보고, 결과값을 검증함 데이터마이닝의 흐름을 파악하고 그 안에서 사용되는 알고리즘에 대한 이해도를 높임
2. 원시 데이터 파일 분석 칼럼분석
2. 원시 데이터 파일 분석 칼럼형 분석
2. 원시 데이터 파일 분석 칼럼형 적용
3. 기본적 통계분석 Data audit
3. 기본적 통계분석 RM
3. 기본적 통계분석 MEDV
3. 기본적 통계분석 RAD
4. 연관성 규칙 분석 RM & MEDV & RAD
4. 연관성 규칙 분석 RM & MEDV & RAD
4. 연관성 규칙 분석 Clementine node 구성
5. 결과해석 MEDV(주택가격)가 14.250이하인 집을 찾는 고객에게 RAD(도로접근지수)가 24인 집을 같이 추천함 반면에 RM(평균방수)이 RAD(도로접근지수)에 영향을 미칠 것이라는 예상은 틀림
6. 결 론 Clementine은 predictive, clustering, association라는 3가지의 modeling 기법을 제공하는데, 프로젝트를 진행하면서 association model을 도출하는데 predictive 기법을 사용하는 등 전반적인 기초 지식이 부족하였다. Clementine은 데이터 타입으로 symbolic(flag, set)과 numeric(range)를 제공하는데, 각 타입에 따라 적용할 수 있는 modeling 기법이 달라서 하나의 기법만으로는 원하는 분석을 시행할 수 없었다.