250 likes | 805 Views
2. 자료의 일반화. 2-1 일반화 개요 2-2 모델 일반화 , 지도 일반화 , 일반화 응용 2-3 일반화 품질 평가 2-4 보간법. 2-1 일반화 개요. 1. 일반화 개요 1) 일반화 정의 일반화란 데이터의 양이 줄어들 경우 정보의 양이 최대한 그대로 유지되는 일련의 기법이다 . . 2) 일반화 유형들 모델 일반화 지도 일반화 배치 일반화 (Batch Generalization) 인터랙티브 일반화 (Interactive Generalization)
E N D
2. 자료의 일반화 2-1 일반화 개요 2-2 모델 일반화, 지도 일반화, 일반화 응용 2-3 일반화 품질 평가 2-4 보간법
2-1 일반화 개요 • 1. 일반화 개요 • 1) 일반화 정의 • 일반화란 데이터의 양이 줄어들 경우 정보의 양이 최대한 그대로 유지되는 일련의 기법이다. . • 2) 일반화 유형들 • 모델 일반화 • 지도 일반화 • 배치 일반화(Batch Generalization) • 인터랙티브 일반화(Interactive Generalization) • 3) 일반화 지식의 세가지 범주 • 일반화 지식의 세 가지 범주들은 룰 기반 시스템을 구현하기 위해 제안되어 지고 있다. • 기하학적 지식(크기, 형태, 거리 등등) • 구조적 지식(지도제작 객체의 근원인 기초 생성 처리 과정) • 절차적 지식(일반화를 위해 필요한 작업의 연속과 작업들
2-1 일반화 개요 • 4) 일반화 미래 연구의 방향 • - 일반적 사항들 • 디지털 환경하에서 일반화 목표를 확인한다. 그것이 언제 그리고 왜 필요한지에 대해 명확히 한다. • 데이터 추상화와 데이터 감소(모델 일반화)를 위한 특정한 방법들을 개발한다. 그리고 지도제작 표현과 관련된 문제, 데이터 감소와 질간의 문제 사이를 명확히 구분한다. • - 지식 형성 • 컴퓨터와 지도제작 전문가 둘 모두와 관련된 지식 획득(확대된 지능 시스템에서 지식 끌어내기, 분해(reverse) 공학, 기계학습, 스크립팅 기술 등)을 위한 모든 가능한 방법들을 개발한다. • 국가지도창과 학계연구간의 연구 협력은 강화되야 한다. 국가지도창은 일반화 기능과 관련한 그들의 요구사항을 분명히 제시해야 하고, 학계는 이러한 문제점 해결을 위한 연구에 착수해야한다. • 기술 개발에 있어 제3의 역할자인 소프트웨어 공급자들은 국가 지도창, 그리고 학계 연구소 간의 연구 활동시에 일어나는 개발과정에 밀접히 관련되야 한다 • - 일반화 연산자들(General Operators) • 그래픽 표현에서 자동화 될 수 있는 연산자들이 무엇인지 확인한다. • 이미 쓰이는 툴들을 더 활용하고 기존 연산자들의 응용성(스케일 범위, 대상 클래스들등)을 평가한다. • 신경망과 유전 알고리듬과 같은 새로운 접근방법으로 실험한다. • - 일반화와 데이터 질 • 모델 지향 일반화와 지도 일반화 둘 모두에 대한 데이터 질 기대치를 분명히 한다. 즉 데이터 질 판단기준의 응용으로부터 생기는 본질적 문제점을 확인한다. • GIS에서 디지타이징된 일반화 지도를 사용함으로서 생기는 잠재적 오차들을 분석한다..
2-2-1 모델 일반화 • 1. 모델 일반화 개요 • 1) 모델 일반화의 정의 • 기하학적 데이터가 변화될 때 위상학적 관계와 비위상학적 관계 혹은 그 둘 모두가 또한 변화된다. 일반화는 위상학적관계의 일관성을 유지해야하고, 대상체들과 비위상학적관계들을 생성∙ 제거하고 추출할 수 있다. 비공간적 성질이 변화되었을때, 그 변화는 일련의 기하학적 변화를 초래하고, 그리고 위상학적 관계나 비위상학적 관계도 아울러서 변화되어질 수 있다. 이런 일반화를 모델 일반화라고 부른다. 모델 일반화는 GIS DB에서 데이터모델의 변화에 주안점을 둔다. • 2) 모델 기반 일반화 구조 • 하나의 대상체(feature)는 위치 정보(기하학적인 것), 비공간적 성질, 위상학적∙ 비위상학적 관계(relation)를 지니고 있다. • 대상체 사이의 관계는 대상 기반 GIS내에서 일반화와 집단화(aggregation)와 같은 추상화를 포함한다. • 3) 모델에 대한 일반화 연산자의 효과
2-2-1 모델 일반화 • 4) DLG(Digital Line Graph)-E 데이터 모델 • DLG-E 데이터 모델링 구조는 Borgida(1986)로 부터 나왔으며, 공간 데이터 전송 표준(Spatial Data Transfer Standard)에서 나온 것과 유사한 개념을 포함한다. DLG-E 구조에서 데이터 모델은 지식을 표현하는 기본 단위 혹은 컴포넌트인 객체들, 속성, 연관관계(relationship)를 포함한다. 또한 이들 컴포넌트는 실세계에서 사상(entity)에 해당한다. • - DLG-E 에서의 컴포넌트 • 사상(entity): 사상은 같은 종류의 현상으로 더 이상 나누어 질 수 없는 실세계 의 현상이다. • 객체(object): 객체는 사상의 디지털 표현이고, 위치와 비위치적 속성 혹은 특징을 가지고 있다. • 연관관계(relationship): 유사한 속성을 가지고 있는 객체들 사이의 위상학적이고 비위상학적인 연결들이다. • 대상체(feature): 대상체는 공통의 속성과 연관관계를 가진 객체들의 클래스이며, 대상체의 개념은 사상과 객체 둘 두를 포함한다. • - DLG-E 계층은 데이터베이스에 관한 5가지 view • Cover: 물리적으로 분명한 영역 넓이 • Division: 행정적 혹은 정치적인 경계 • Ecosystem: 자연적인 cover에 의해 정의된 것 예) 습지 • Geoposition: 측지학적인 제어 • Morphology: 풍경 지문학에 의해 정의된 것 대축척(7.5-minute) DLG의 경계, 수계, 도로 자료층(layers)
2-2-1 모델 일반화 • 5) Brassel and Weibel 모델 • 공간 자료의 일반화에 대한 가장 세부적인 개념적 모델중의 하나는 스위스 취리히 대학의 Kyrt Brassel과 Robert Weibel 에 의해 개발되었다. 이들이 개발한 모델은 디지털 환경에서 일반화가 다섯 가지 독립 처리과정으로 나누어질 수 있다는 것이며 특히 첫 번째 일반화 처리과정에 중점을 두었다. • - Brassel and Weibel 모델의 특징: Brassel and Weibel는 디지털 일반화에 대한 대상물의 통계적이고 지도학적인 두 가지 형태에 초점을 맞추었다.통계적 일반화는 여과처리과정으로서 정의하였고 그 주된 관점은 자료압축과 통계적 분석이다. 지도학적 일반화는 시각적 효과를 증가시키기 위하여 지도상에 있는 구조물을 수정하는 것으로 본다. • 6) Ratajski 모델 • 유럽에 있어서 지도 일반화와 관련된 중요한 개념적 모델로서 폴란드의 지도학자 Lech Ratajski가 ‘phenommenes des points de generalization’(Ratajski 1967)란 제목으로 발표하였다. Ratajski의 개념적인 구성은 일반화 처리과정의 2가지 기본형태로 나타나며, 이는 축척변화에 따라 점차적으로 축소되는 양적인 일반화와 부호적인 기본형태의 변화에서 추상적인 형태로 변환하는 질적인 일반화이다. • - Ratajski 모델의 특징: Ratajski의 일반화에 관한 모델은 질적인 측면과 양적인 측면의 두 가지로 구성된다.이 두 측면의 조합은 대상체들의 추상적 표현을 연속적으로 나타낸다. • 7) Nickerson and Freeman 모델
2-2-1 모델 일반화 • 8) Buttonfield의 Strip Tree Geometry • Strip Tree Geometry 알고리즘은 우선 처음 시작점과 끝의 점 및 두 점을 연결한 선분과 가장 멀리 떨어져 있는 점들을 연결하는 최대 사각형을 구성한다. 이어서 가장 수직거리가 큰 정점을 중심으로 사각형을 두 개로 나눈 다음 각각의 사각형내에 위치한 정점들을 포함하는 사각형 (strip 1과 strip 2)을 만들게 된다. 연속적으로 동일한 방법을 이용하여 이러한 strip을 만들 수 있으며 사용자는 반복 횟수를 정의할 수 있게 된다. 이렇게 하여 만들어진 strip내의 처음과 끝점을 연결하는 벡터에서 각각의 정점에 대한 수직거리를 계산하여 주어진 허용오차보다 적은 경우에는 그러한 정점들을 제거할 수 있다. 이러한 방식에서 나오는 정점의 제거를 통한 단순화는 반복의 횟수가 많아질수록 사각형이 많이 만들어지며, 원래의 객체에 근접한 형태를 유지할 수 있다. 반면 반복횟수가 적어질수록 처리시간은 적게 걸리나 원래의 형태에서 멀어지는 단점이 있다. • 9) 완만화 (Smoothing) • 완만화는 선의 가장 중요한 특징점만을 취득하여 좌표 쌍들의 위치 재조정이나 이동에 의하여 선을 유선형으로 변화시키는 과정을 말한다. 완만화 기법은 선의 외형을 개선하기 위하여 점의 위치를 바꾸거나 중간에 필요한 점들을 추가하는 방식등으로 작은 변동이나 변화가 있는 부분에 대하여 평탄화를 실시하는 것을 의미한다. 일반적으로 수치화된 선형자료는 점의 연속으로 제작되기 떄문에 디지타이징된 선들은 변곡점에서 돌출된 모양이 많아 시각적으로 그다지 좋지 못하므로 이러한 경우에 완만화가 많이 이용된다 Buttonfield의 Strip Tree Geometry 완만화(smoothing)에 의해 변화된 선
2-2-1 모델 일반화 • II. GIS에서 모델 일반화를 위한 일반 구조 • 1) 셀(cell)기반 GIS 일반화 기법 • 셀 기반 모델은 주요 대상체와 이미지 구조를 가질 것이고 최확치 필터링은 스무딩 효과를 보일 것이다. 만약 그것이 조사된 집단과 같은 상태라면 변하지 않는 상태가 되고, 그렇지 않으면 국지적으로 대다수 값의 상태로 바뀐다. GIS에서 모델 일반화를 위한 기본 틀
2-2-1 모델 일반화 • 2) 셀(cell)기반 GIS 일반화 기법 예 • 분류된 하나의 항만 지역의 위성 이미지(좌)가 셀 기반 모델에 의해 일반화된 예(우)로서 보여진다. 여기서 확장된 무어(Moore) 근접 알고리즘(그림 1)이 셀 기반 모델에 적용된다. 기본적으로 특징 셀의 상태는 이웃 셀 집단의 것과 비교되며, 여기서 셀 기반 모델과 최확치 필터링(majority filtering)의 결합은 더 낳은 결과를 주기 위해 사용된다. 분류된 이미지(좌)와 일반화된 이미지(우) 그림 1
2-2-2 지도 일반화 • 1. 지도일반화 개요 • 1) 지도 일반화의 중요성 • 공간분석을 위해서 대상물을 같은 종류끼리 묶고 대상물의 형태를 단순화함으로써 복잡성을 감소시키는 행위를 일반화(generalization)라고 한다. 일반화는 원하는 축척의 지도를 제작하기 위하여 필수적이며 현재 여러 가지 일반화 방법이 개발되어 있다. • 2) 대상물 선택 (feature selection) • 지도 일반화에 앞서 대상물 선택의 과정이 있어야 한다. 대상물 선택은 지도의 목적에 따라 표현할 대상물과 그렇지 않은 것을 선택하는 것을 말하며 선택과정에서 대상물의 변형은 발생하지 않는다. 대상물 선택 과정에 많은 시간을 투자할수록 전체 지도 제작 시간을 더욱 크게 줄일 수 있다. • 3) 지도 일반화의 종류 • 지도 일반화에는 분류(classification), 단순화(simplification), 과장(exaggeration), 기호화(symbolization), 추론(induction) 등 다섯 가지의 중요한 개념이 있다. 분류는 대상물들을 속성과 속성값에 따라 순서를 정하고 비교하여 같은 종류끼리 묶는 작업을 말하며, 단순화는 대상물의 중요한 속성을 선택하여 필요 없는 속성은 제거하는 것을 말한다. 과장은 중요한 속성을 강조하는 것을 말하며, 대상물 정보를 그래픽 기호로 표현하여 지도에 표현하는데 이것을 기호화라 한다. 추론은, 사용자가 추가적인 속성 정보를 지도상에 표현된 대상물들 간의 관계를 고려하여 추론을 통해 얻어내는 것을 말한다.
: 축척 의 새로운 지도에서의 개체수 • : 축척 의 원래 지도에서의 개체수 점, 선, 면의 분류에 의한 군집화 2-2-2 지도 일반화 • 2. 지도 일반화의 요소 • 1) 분류(classification) • 분류의 목표는 대상물들을 그들의 속성이나 속성값으로 정렬하고 비교하여 묶어서 대표적인 특성을 추출하는 것이다. 즉 유사한 현상들을 군집화하여 보다 일반적인 특성을 찾아내는 것이다 • 2) 단순화(simplification) • 대상물의 중요한 속성 특성만을 취하고 필요 없는 특성은제거하는 것을 말한다. 대상물을 직접 표현하는 것 대신기호(symbol)를 사용할 수 있으나 축척이 더욱 작아지면표현할 대상물의 수를 줄여야 한다. 또한 대부분의 경우,개체수를 줄이는 것뿐만 아니라 남아 있는 개체들을평활화(smoothing)하여 상세도(detail) 역시 감소시켜야한다. 표현할 개체수를 어느 정도로 줄여야 하는가는Topfer의 Radical 법칙으로 결정할 수 있다. • ※Topfer의 Radical 법칙 (간략식) • 지도 축척과 지도상에 표현할 수 있는 개체 수와의 관계는다음과 같이 표현할 수 있다.
2-2-2 지도 일반화 • 3) 과장(exaggeration) • 대축척 지도에서나 표현이 가능한 대상물을 소축척 지도에표시하거나 지도의 목적에 따라 특정 대상물을 강조해야 할경우 사용하는 방식이 과장이다. 이를 위하여 대상물의외곽선을 분석하고 특징적인 형태를 유지시키는 작업이필요하며 대상물을 최대한으로 자세한 표현하는 것보다는명료하고 안정되며 부드러운 선을 사용하는 것이 낫다. • 4) 기호화(symbolization) • 기호화란 대상물을 그래픽 표시로 바꾸어 지도상에표현하는 것을 말한다. 실존하는 물질적인 대상물뿐아니라 개념, 사실, 지리적 특성 등도 기호화 할 수 있다.
2-2-2 지도 일반화 • 3. 일반화에 영향을 주는 요소 • 1) 지도의 목적과 사용 조건 • 지도의 목적과 사용 조건은 일반화에 매우 큰 영향을 준다. • 2) 지도 축척 • 지도 축척이 작을 경우 더욱 높은 수준의 일반화를 요구하고 축척이 클 경우는 단순화보다는 분류나 기호화를 요구하게 된다. 소축척의 주제도의 경우에는 단순화와 과장이 가장 중요한 요소가 된다. 이와 같이 각각의 축척에 맞는 일반화의 수준이 있으며 대상물 항목간의 균형과 일관성이 필요하다. • 3) 자료의 질과 양 • 지도는 지리정보에 대하여 권위 있고 정확한 정보를 제공해 주어야 한다. 그러나 일반화에 의하여 지도의 정확성은 감소할 수 있다. 따라서 지도에 정확도를 표시해 줄 필요가 있으며 이를 위하여 reliability diagram(지도의 각 위치에 따른 정확도를 표현함)를 넣거나 기타 일반화에 의한 왜곡이 발생한 대상물을 표시해 주는 것도 좋다(예, 일반화된 도로 등). 만약 지도 제작을 위한 자료의 양이 적다면 보다 소축척으로 일반화 하여 제작을 해야 하며 자료의 양이 너무 많다면 꼭 필요한 자료만을 선택하기 위한 세심한 고려가 필요하다. • 4) 그래픽의 제한 • 그래픽의 제한은 두 가지 분야에서 생각할 수 있는데, 하나는 지도 제작 기술의 한계이고 다른 하나는 사용자 지각 능력의 한계이다. 지도상에서 기호를 표현하는 것은 물리적 한계, 생리적 한계, 심리적 한계에 의해 제한된다. 물리적 한계는 지도 제작을 위한 장비, 재료, 기술의 한계를 말하고 생리적 한계는 사용자가 겪는 유사 크기, 색조, 색상의 구별 곤란 등을 말하며, 심리적 한계는 근접 대상물의 구별 혼란 등을 말한다. 즉, 생리 및 심리적 한계는 사용자가 대상물을 인식하고 반응할 수 있는 한계를 말한다. 시각적 한계에는 지도의 최대 크기, 선의 두께, 글자의 형태와 크기, 기호의 크기와 형태 등이 있다.
2-2-3 일반화 응용 • I. 실시간 데이터 일반화와 통합 • 1) 개요 • 인터넷에 분포된 지도 데이터의 양은 계속적으로 증가하고 있다. 오늘날 데이터의 대부분은 래스터(raster) 데이터이지만, 최근에 만들어진 XML표준은 인터넷에 벡터 데이터를 분포시키는 일을 쉽게 만들고 있다. 벡터 데이터 이용의 주요 장점 중에 하나는 래스터 데이터보다 벡터 데이터를 통합하고 일반화시키기가 더 쉽다는 점이다. 데이터 통합과 일반화를 수행하기 위해서는 적합한 기술적 환경이 필요하다. • 2) 시스템 구조 • Java Topology Suite내의 공간 연산을 사용하여 데이터 통합과 일반화 알고리즘을 구현한다. • GML 파일을 읽는 자바 기반 루틴(routine)을 사용하고 기하(geometry) 클래스들에서 객체들을 생성한다. • JTS로부터 클래스 라이브러리를 이용한 GML 명세(specification)의 자바 구현은 JGML이고 이를 이용한 자바 뷰어(viewer) 모습은 아래와 같다. JGML 뷰어에서 표현된 특정 도시의 데이터 데이터베이스에서 사용자까지 지도 벡터 데이터를 분배하는 도식
2-2-3 일반화 응용 • II. 위치 기반 서비스를 위한 일반화와 통합 • 1) 개요 • 개방형 지리정보시스템 컨소시엄(Open GIS Consortium)은 지도 데이터를 처리하는 웹서비스를 위한 명세(specification)를 만들어내고 있으며 이러한 명세에는 WMS(Web Map Service, 2003), WFS(Web Feature Service, 2003), OpenLS(Open Location Service, 2003) 그리고 GML(XML application geographic markup language)이 있다. 위치 기반 서비스를 시행하기 위해서는 서비스 데이터와 지도 데이터는 실시간으로 통합되고 일반화되어야 한다. 서비스 데이터가 OpenLS ADTs(abstract data types)로서 정의된다고 가정했을 때의 몇 가지 일반화와 통합 방법을 제시한다.. • 2) 실시간 일반화와 통합 • 모든 일반화와 통합에 관한 사항들은 데이터 처리 자료층에서 수행되는 것을 우선시하며, 데이터 통합 방법은 다른 자료층에서 수행될 수도 있다 • 일반화에 사용된 두 가지 기술을 제시하면, 하나는 XSL 변형(XSLT, 아래 그림에서 화살표6b와 7b에 해당)에 기반을 둔 것으로서 XSLT는 한 문서(document)가 다른 문서로 이동되는 규칙을 정하는 XML응용이다. 다른 하나는 자바에 기반을 둔 것으로서 하나의 프로그램이 화살표 6a, 7a, 8a, 9a를 구현하도록 개발되고 있는 상황이다. 이 프로그램은 공개소스코드인 JTS(Java Topology Suite)와 JTS Conflation Suite(Vivid Solutions, 2003)를 기반으로 한다. XSLT대신에 일반화를 위해 자바를 사용하는 주된 이유는 일반화 처리 과정에서 대상체들 사이의 연관관계를 다룰 때 XSL 변형에서 생기는 장애 때문이다 특정 프로젝트를 위해 개발된 일반화 서비스 내부 작업흐름
2-2-3 일반화 응용 • II. 위치 기반 서비스를 위한 일반화와 통합 • 3) 일반화와 통합 방법들의 적용 • - 선택(selection) 과 단순화(simplification) - 그래픽 일반화(Graphic Generalization) • - 다른 데이터 세트로부터의 지도 데이터의 통합 - 지도 데이터와 기하 서비스 데이터의 통합 왼쪽지도는 원 데이터 세트이고 오른쪽 지도는 같은 데이터 세트를 이용하여 XSLT 처리과정에 의해 변형된 데이터를 보여줌. 여기서 선택과 단순화의 일반화 변형과정이 사용됨 좁은 지역에서의 ‘동시 그래픽 일반화’의 예원 객체들은 음영으로 나타나고 일반화된 객체들은 완전한 색채로 나타남 다른 데이터 세트로부터 지도 데이터의 실시간 통합의 예 지도 데이터와 기하 경로 데이터의 통합 예.경로 데이터는 지형도로부터 디지타이징된 것임
2-2-3 일반화 응용 • III. 3차원 건물 데이터 일반화 • 1) 개요 • 도시와 자연 풍경의 3차원 모델링은 점점 더 대중적이고 널리 쓰이고 있다. 자동화 툴과 기법들의 이용이 상당 부분 가능해지고 있으며 더욱 세분화된 3차원 도시 모델의 효율적인 기법들이 연구되고 있다. 이런 발전에 맞추어 어떻게 하면 거대한 데이터 세트를 효율적으로 다루고 분석하고 시각화할 수 있는지에 관한 관심이 증대되고 있다. 시각화와 관련하여 컴퓨터 그래픽 분야에서 쓰이는 LOD(Level of Detail) 개념이 그러한 정보를 표현할 메커니즘을 제공하고 있다. 그러나 여기서의 화두는 어떻게 하면 다중 축척 건물 표현을 자동으로 얻을 수 있느냐 하는 것이다. 이것은 일반화 문제이다. 매우 세분화된 3차원 건물 일반화와 관련된 적지 않은 연구가 현재 국내외에서 진행중이다 • 2) 단순화와 일반화 • 단순화는 데이터의 양을 감소시키기 위해 필요하며 단순화를 통해 실시간으로 시각화(visualization)를 구현하는 것이 가능해 진다. 표면 단순화(surface simplification)를 위해 vertex, edge, 면(face) 감소 과정 등이 사용된다 • 3) 3차원 건물 단순화의 접근 • - 수행 절차 • 대상체 탐지 • 본체의 분할과 CSG 표현을 이용한 대상체 추출 • 일반화 대상체 탐지를 위한 두가지 가능성 a: 경계면을 가진 교차(intersection)의 두 가지 다른 결과 b: 대상체 초기값을 가진 외접 연산 enclosing(b.1), wrapping(b.2)
2-3 일반화 품질 평가 • 1. 일반화 평가 • 1) 일반화 평가 고려 요소 • 일반화 처리과정은 위치 정확도, 형태정확도, 속성 정확도, 완결성 그리고 일관성 등에 영향을 준다. 수행된 일반화 처리과정의 목적은 무엇이었으며 그 결과들은 그 목적에 얼마만큼 부합되는지 고려될 것이다. 모델 일반화 환경에서의 자료 질과 지도 일반화에서의 자료 질은 목적의 차이로 인해 구별된다. • 2) 수치지도 일반화 위치 정확도 평가 • 수치지도 일반화 처리 과정을 통해 생성된 수치지도상의 공간자료에 관한 질을 평가하는 것은 매우 중요한 작업이다. 변환된 수치지도 자료가 해당 축척의 수치지도 규정 및 정확도에 부합되도록 하기 위해 이론적 기대정확도의 허용범위가 고려되야하고 공간자료의 질 평가 기준의 정립이 요구된다. • - 기본 평가 방안 • 대축척에서 소축척으로의 변환과 같은 축척 변경에서는 정보의 고밀도화로 정보 전달의 어려움이 발생한다. 이것은 일반화 처리과정 중 각 레이어별 축척에 따른 상관성 분석을 통해 삭제 및 표현되어야 할 대상물(feature)을 결정함으로써 해결될 수 있다. • 수행된 일반화 알고리즘들은 공간적인 위치변화를 야기하고, 통계적 모형으로 이때의 위치정확도를 평가하는 것은 어렵다. 이것은 어떤 정보를 형성하고 있는 해당 지점들의 삭제와 새로운 생성으로 인해 한 지점에 대한 공간적 위치비교가 불가능하기 때문이다. • 각 지점에 대한 위치정확도를 비교하는 것 보다는 해당 정보에 대해 공간적인 위치오차의 허용범위를 결정하고 각 지점의 삭제나 생성에 관계없이 그 공간적인 변화가 위치오차의 허용범위를 벗어날 경우 오차로 간주하는 것이 전체적인 위치정확도의 유지에 좋다. • 도로나 등고선과 같은 선형자료를 단순화 처리하고 이것이 허용오차이내에 있는 지를 판단하기 위하여 원래의 선 형을 허용오차만큼 버퍼링(buffering)하여 단순화된 선형과 중첩하는 방안이 있을 수 있다
2-3 일반화 품질 평가 • II. 일반화 효과 • 1) 개 요 • 일반화는 처리과정의 자동화에 대한 추진, 축척 독립적 데이테베이스 발전, GIS내에서 종이지도상에서 보다도 더 자료에 심각한 영향을 끼칠 수 있는 등의 이유 때문에 GIS에서 중요한 과정으로 받아들여 진다. 그럼에도 불구하고 일반화의 효과 즉 정량적인 평가는 거의 존재하지 않고, 정성적인 방법들을 이용한 일반화 결과 표시가 주로 이루어지고 있는 형편이다. 한편, 지도 제작과 관련된 전체 오차를 평가하는 것은 매우 어려운 일이다. 왜냐하면 여러 다른 지도제작 과정, 매체의 치수 불안정성, 그리고 원자료의 디지타이징 절차등에서 생긴 다양한 오차들사이의 기능적 관계가 잘 알려지지 않고 있기 때문이다. • 2) 비교 • - 모델 일반화 • 주로 필터링(filtering) 과정에 해당한다. • 디스플레이 목적으로 쓰이지 않는다. • 자료 분석 목적으로 원 데이터베이스의 서브세트(subset) 획득과 같은 자료 감소에만 쓰인다. • 수동 일반화와 동등하지 않고, 디지털 시스템에만 어울린다. • - 지도 일반화 • 그래픽 디스플레이를 위해서 쓰여진다. • 지도의 시각적 효과와 가독성(可讀性) 향상에 목적을 둔다. • 수동 일반화에 적용된 것과 같은 원리들에 종속된다. • 3) 분석 • 모델 일반화는 더 적은 일반화 효과를 일으켜야 한다. 왜냐하면 자료 감소는 정량적인 통계적 제어하에서 이루어지기 때문이다. 이 경우 소스(source) 자료의 수정은 최소화하면서 자료양의 감소는 동시에 최대화된다 • 지도 일반화는 모델 일반화 보다 일반화 효과를 더욱 많이 일으킨다. 왜냐하면 지도 일반화는 비통계적이며, 편차와 삭제(elimination), 형태 왜곡, 강조와 관련된 특별한결정을 채택함으로써 이루어지기 때문이다.
2-4 보간법 • I. 보간법 • 1) 개 요 • 영상 처리에서 주어진 원영상을 확대하는 것은 원 영상의 각 픽셀의 좌표를 확대하려는 배율만큼 이동하는 것을 말한다. 하지만 영상 확대시 값을 할당 받지 못한 픽셀들이 존재한다. 이를 홀(Hole)이라 하는데, 빈 픽셀에 적당한 데이터 값들을 할당하여 사용하는 처리 방법을 보간법(interpolation)이라 한다. 알려진 점들을 이용하여 만들어진 선형식(linear function)이나 다항식의 회귀분석(regression analysis), Fourier급수, Spline, Moving average, Kriging 등에 의해 공간상에서 보간이 이루어진다. DEM(Digital Elevation Model) 구축에서 보간법은 표고가 측정되지 않은 지역의 표고를 추정하는데 사용된다. DEM구축을 위하여 필요한 모든 지점의 표고를 원 자료에서 모두 측정하는 방법은 비용이나 시간적 측면에서 비효율적이다. 따라서 원 자료로부터 적당한 표본 지점들의 표고를 직접 측정하고, 그 외 지점들의 표고는 이들 표본 표고점들로부터 보간에 의해 구하는 방법이 일반적이다 • 2) 보간법 정의 • 보간(interpolation)이라는 말은, 기존에 알고 있는 특정 지점이나 지역의 속성값을 이용하여 알려지지 않은 지점이나 지역의 속성값을 찾아내는 것을 말한다. • 우리가 알고 있는 두 점의 값을 이용해서 두 점 사이의 임의 점에서 값을 찾아낼 때 쓰는 방법이기도 하다. • 영상내에서 픽셀들을 움직이거나 픽셀들을 생성하는 방법이다. • 곡선상에 놓여있는 위치 좌표들 사이에서 임의의 공간 위치 값을 유도하는 과정이다.
2-4 보간법 • II. 보간법 유형 • 1) 최근린 보간법 (Nearest Neighbor Interpolation) • 2) 겹선형 보간법 (Bilinear Interpolation) • - 정의 • 영상 처리에서 가장 보편적으로 사용되는 보간 기법은 겹선형 보간법(bilinear interpolation)이다. 겹선형 보간법에서 생성되는 픽셀은 네개의 가장 가까운 픽셀들에 가중치(weight)를 곱한 값들의 합이며, 가중치들은 선형적인 방법으로 결정된다. 각각의 가중치는 각각의 존재하는 픽셀로부터 거리에 반비례한다 최근린 보간 함수와 최근린 보간법을 이용한 픽셀 보간 예
2-4 보간법 • II. 보간법 유형 • - 단순 겹선형 보간법 (Bilinear Interpolation) 을 이용한 확대 • 평균값을 이용한 보간법은 확대 영상에서 주변 픽셀들의 평균값을 계산하여 할당 받지 못한 빈 픽셀에 대입시키는 방법이다 • 4개의 주어진 값들 사이의 새로운 값을 만들어내는 방법이다. 두 방향의 선형 보간법과 관련되 있다. • 새롭게 생성된 픽셀의 값이 네 개의 가장 가까운 픽셀들에 가중치를 곱한 값이 된다. 주변 픽셀들의 평균값을 이용한 보간법 처리과정과 겹선형 보간 함수
2-4 보간법 • II. 보간법 유형 • 3) 고등차수 보간법 (High Order Interpolation) • - 개요 • 최근린 보간법은 입력의 한 픽셀값을 요구한다. 겹선형 보간법은 새로운 픽셀을 생성하기 위하여 네개의 이웃한 픽셀들을 사용한다. 삼차상승 보간법(Cubic Convolution Interpolation)과 B-SPLINE 보간법은 출력 픽셀을 생성하기 위하여 16개의 이웃한 픽셀을 요구한다. 모든 보간함수들은 같은 원리에 의해 작업이 이루어 진다. 보간함수는 계산해야 할 한 점의 중앙에 놓여지고 샘플점들의 값들은 샘플들에 의해 곱해진다. 모든 경과들의 합은 새롭게 형성되는 픽셀값이 된다. 이것은 상승(Convolution)의 동작과 유사하다. • - 유형 • 3차 상승 보간법 (Cubic Convolution Interpolation) • B-스플라인 보간법 (B-SPLINE Interpolation) • 4) 크리깅(Kriging) 보간 • 크리깅모델은 기본적으로 실험 점들에서의 오차가 서로 독립적이지 않고 서로 연관성을 가진다는 가정하에서 시작된다. 만약, 최소 제곱법에 의한 회귀모델을 생성하였을 경우 추정값과 실제값 사이에 큰 오차가 있다면 그 추정값에서 매우 가까운 지점에서의 추정값 또한 실제값과 큰 오차를 가질 것이란 사실을 예상할 수 있을 것이다. 이것은 최소제곱법에 의한 회귀모델이 계통적인 오차(systematic error)를 가지기 때문이다. 크리깅모델에서는 확정론적인 응답을 회귀모델을 포함하는 임의 모델의 구현으로 처리하고 있다