140 likes | 370 Views
RPTree code analytics(3). Jeonbuk National Univ. Database Laboratory Kim Tae Hoon. Contents. Update_thresh Update_thresh 예제 소스 Update_thresh 수행 예제 Classify Classify 예제 소스 Classify 수행 예 Classify 데이터 파라메터 설정 Classify 그루핑 및 분리된 데이터 분포 확인. double update_thresh. 파라메 터
E N D
RPTree code analytics(3) Jeonbuk National Univ. Database Laboratory Kim Tae Hoon
Contents • Update_thresh • Update_thresh예제 소스 • Update_thresh수행 예제 • Classify • Classify 예제 소스 • Classify 수행 예 • Classify 데이터 파라메터설정 • Classify 그루핑 및 분리된 데이터 분포 확인
double update_thresh • 파라메터 • RPNode* n : 어떤 ndx에 해당하는 RPNode • const int proj_num : (n = 0, 1, 2, … n : NUM_PROJ) • 함수 역활 • 점들 사이에 따른 분할 기준 거리 중 평균치인 최대치 maxx값 반환 • 변수 • P1, P2 : LargeBin, SmallBin연산 결과 누적 저장 • M1, M2 : bin_mean과 LargeBin, SmallBin의 곱 연산 결과 누적 저장 • Threshold : 점들의 분할 경계 지점의 임계치를 저장 • Tmp : 해당 노드에서 점들 사이에 따른 평균분할 기준 거리 계산 결과 업데이트
update_thresh수행 예제 P1, P2 Bin Index 범위 For Index 범위
update_thresh수행 예제 M1, M2 LargeBin index 짝수일 경우 M1+= LargeBin index 홀수일 경우 M2+= stddev mean
update_thresh수행 예제 M1, M2 • 파랑 셀일 경우 M1 • 초록 셀일 경우 M2
unsigned intclassify(283~312) • 파라메터 • RPNode* n : 어떤 ndx에 해당하는 RPNode • t_data* data : sin3d.data 파일 • 함수 역활 • RPTree가 구성된 트리 정보를 비트맵 으로 나타탬 • 출력을 비트맵 형식으로 나타내며이를 integer로 반환 • 변수 • bit_mask : 비트 마스크 연산을 위한 변수 • Path_To_take : 비트 마스크 연산 후 지나간 path 리턴
Classify 수행 예제 • 반환된 값이 2일 때 • 비트맵 : 0010 • 반환된 값이 4일 때 • 비트맵 : 0100 1레벨 2레벨 3레벨 Shift Shift • BITMAP = 2 • BITMAP = 4 0010 0100 PTH += 6 PTH += 4 return
데이터 파라메터 설정 • 원본 데이터 10000개 총 1000개의 DATA 택 • VECT_LEN 3 • 10개의 PROJ_NUM • MAX_TREE_DEPTH 4
Classify 데이터 분포 Sin3d.cls - 비트맵 set 그루핑