120 likes | 265 Views
정보공학. 2006.04.03. 생물정보학 전공 나영지. Outline. 관계 데이터베이스 연역 데이터베이스 객체지향 데이터베이스 연결기반통합 지식기반 Computer graphic. 데이터베이스의 개념. 데이터베이스의 정의 한 조직의 여러 응용 시스템들이 공용할 수 있도록 통합 , 저장된 운영 데이터의 집합 데이터베이스 관리 시스템 (DBMS) 응용 프로그램과 데이터의 중재자로서 모든 응용 프로그램들이 데이터 베이스를 공용할 수 있게끔 관리해 주는 소프트웨어 시스템 데이터베이스 스키마
E N D
정보공학 2006.04.03. 생물정보학 전공 나영지
Outline • 관계 데이터베이스 • 연역 데이터베이스 • 객체지향 데이터베이스 • 연결기반통합 • 지식기반 • Computer graphic
데이터베이스의 개념 • 데이터베이스의 정의 • 한 조직의 여러 응용 시스템들이 공용할 수 있도록 통합, 저장된 운영 데이터의 집합 • 데이터베이스 관리 시스템(DBMS) • 응용 프로그램과 데이터의 중재자로서 모든 응용 프로그램들이 데이터 베이스를 공용할 수 있게끔 관리해 주는 소프트웨어 시스템 • 데이터베이스 스키마 • 데이터 구조와 제약 조건에 대한 명세를 기술한 것
데이터 모델링 • 데이터 베이스는 계속적으로 변화하는 현실 세계를 표현함. • 이 현실 세계를 데이터베이스에 표현하는 중간과정을 데이터 모델이라고 한다. • 이러한 현실 세계를 이해하고 다른 사람과 통신하기 위해서는 추상화란 방법을 사용한다. • 계층 데이터 모델 : 데이터 베이스의 논리적 구조를 트리 형태로 표현한 구조도를 말한다. • 네트워크 데이터 모델 : 데이터 베이스의 논리적 구조를 표현한 데이터 구조도가 그래프 형태인 것을 말한다. • 관계 데이터 모델 : 사용자로 하여금 데이터베이스가 테이블의 집합으로 되어 있다고 생각하게 한다.
관계 데이터베이스 • Relation(관계) 이라 불리는 표(table)의 형식으로 자료를 저장하고 데이터베이스의 구조를 테이블 형태로 기술하여 표현하는 방법 • 모든 Entity Set과 관계 등을 모두 테이블로 표현 • 관계적 데이터 베이스의 특징 • 동일한 tuple(테이블의 행)들은 각 relations(몇 가지 특성(entry)을 2차원 테이블로 표현 • 각 entry는 단일값을 가지며 그룹 항목이나 배열을 사용할 수 없다.(attribute로 구성된 tuple의 집합)에 존재할 수 없다. • 관계형 모델의 기본적인 데이터 구조는 테이블 (table) 이다. 이 테이블은 열 (column) 과 행 (row) 들로 구성되는 2 차원 구조를 가지며, relation이라고도 함. • 장점 : 다른 모델로의 변환이 쉽고, 데이터들간의 관계를 이해하기 쉽다 • 단점 : 실제 구현과 관리가 어려우며, 성능이 저하된다. • 데이터를 참조하는 방법으로 집합연산, selection, projection, join, division 등이 있다.
정의 • Relation(Table) : 일정한 법칙을 부여한 데이터의 집합, 즉 데이터를 포함하고 있는 • Tuple : 튜플은 테이블의 행 • Attribute : 테이블의 열 • Primary Key : 기본키는 테이블의 유일한 식별자(Identifier). 즉, 주어진 임의 시간에 테이블의 두 행이 한 열(혹은 열의 조합)에서 같은 값을 갖지 않는 성질이 있는 열(혹은 열의 조합)을 의미. • Domain : 값들의 Pool로써, 특정한 relation의 특정한 속성으로부터 실제값을 취한다. • Degree : 속성의 수 • Cardinality : 튜플의 수
관계데이터 조작 - 관계형 대수 [ 특수관계형 연산 ] • UNION • Intersect • Difference • Product [ 일반집합연산 ] • Restriction • Projection • Divide • JOIN
연역 데이터베이스 • 연역 데이터베이스는 관계 데이터베이스와 논리 프로그램 인터페이스로 구성 • 가계도 같은 데이터의 경우 연역데이터베이스를 사용함으로써 잘 해결될 수 있다. • 부모-자식 관계이고 부모-자식 관계를 재귀적으로 사용함으로써 가계도안의 개인 식별가능(서술논리) * 서술논리: 논리 연산자들과 결합될 수 있는 일종의 논리적 표현 예. X, Y가 주어졌을 때, X는 Y의 부모다. - 1차 서술논리 : 3가지의 논리 표현 - Horn 절(clause) 1) P <- Q1, Q2, …, Qn : 규칙(rule) 절 2) <- Q1, Q2, …, Qn : 목적(goal) 절 3) P <- : 단일 절 '부모( X, Y )'와 조상( X, Y ) : 단일 절 조상( X, Y ) <- 부모( X, Y ) : 규칙 절 조상( X, Y ) <- 부모( X, Y ), 조상( X, Y ) : 규칙 절, 재귀적 규칙 <- 부모( X, '철수') : 목적 절 세번째 유형의 Horn 절로 가계도를 나타낼 수 있다. - 사람( '철수', '남자', '태수', '은영', '예' ) - 사람( '영호', '남자', '태수', '은영', '아니오' ) • 연역 데이터베이스는 1차 서술 논리 안에서 두 유형의Horn 절들을 결합한 관계 데이터베이스의 확장이다.
객체지향 데이터베이스 • 추상 데이터 유형 때문에 실세계 데이터를 더 유연하게 표현할 수 있다. • 절차적인 경향(연역, 관계 데이터베이스는 선언적인 방법으로 틀에 박힌 데이터의 표현 방식) • 관계 대수학이나 서술 논리와 같은 수학적 또는 논리적 기초가 부족하기 때문에 컴퓨터 계산 능력면에서는 다른 두 데이터베이스보다 취약
연결 기반 통합(Link-based integration) • 폭발적인 데이터 수의 증가로 데이터들 사이의 조화가 어려워지게 되었다. 이로서 관계 데이터베이스에서 보여지는 스키마의 강력한 통합과 대조적으로 이런 약한 통합인 연결 기반 통합이 보다 더 실용적이게 되었다. • 단지 플랫 파일과 같은 엔트리(entry)로 구성. • 엔트리의 관련성으로 데이터들의 정보 획득.
지식기반 (Knowledge base) • 기존의 지식으로부터 새로운 지식의 생성 • 정보 검색만을 위한 관계 데이터베이스와 대조적으로 연역 데이터베이스는 논리적인 추론에서 이용되는 사실과 법칙의 동적인 모임으로 이는 전형적인 지식기반이다. • A -> B -> C 일때 A -> C 임을 추론할 수 있다.
컴퓨터 그래픽(Computer Graphic) • 생물고분자의 3차원 구조 표현 모델 - 와이어-프레임(wire-frame) 모델 : skeleton 모델, 원자와 공유결합을 각각 점과 선으로 표현 - 구-막대(ball-and-stick) 모델 : 유한한 원자의 크기를 표현하기 위해 점 대신에 구를 사용 위 두 모델은 원자의 네트워크를 보여주는 데 적당. - 리본(ribbon) 모델 : 2차 구조인a-helix나 b-sheet의 배열을 강조 - 공간 채움(space-filling) 모델 : 분자의 전체적인 모양이나 부피에 대한 느낌을 표현