1. 모델링의 이해
가. 모델링의 정의
: 다양한 현상에 대하여 일정한 표기법으로 표현해 놓은 모형
: 현실세계를 추상화, 단순화, 명확화 하기 위해 일정한 표기법에 의해 표현하는 기법
나. 모델링의 특징
- 추상화 : 다양한 현상을 일정한 양식인 표기법에 의해 표현 (모형화, 가설적)
- 단순화 : 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 하는 개념
- 명확화 : 애매모호함을 제거하고 정확하게 현상을 기술
다. 모델링의 3가지 관점
모델링 : 데이터관점 + 프로세스관점 + 데이터와 프로세스의 상관관점
- 데이터 관점 (What, Data) : 어떤 데이터와 관련있는지, 데이터간의 관계는 무엇인지 모델링
- 프로세스 관점 (How, Process) : 실제로 하고 있는 일은 무엇인지, 무엇을 해야하는지 모델링
- 상관관점 : 업무가 처리하는 방법에 따라 데이터는 어떻게 여향을 받고 있는지 모델링
2. 데이터 모델의 기본 개념의 이해
가. 모델링의 정의
: 해당업무에 어떤 데이터가 존재하는지, 필요로 하는 정보는 무엇인지 분석
: 업무규칙에 대하여 판별할 수 있는 사실을 데이터에 접근하는 방법, 사람, 독립적인 관점에서 명확하게 표현하는 추상화 기법
<데이터 모델링의 주요 이유>
1) 기초가 되는 정보를 일정한 표기법으로 표현 → 업무내용을 정확하게 분석
2) 실제 데이터베이스 생성, 개발 및 데이터 관리 사용을 위해
3) 정보시스템을 구축하기 위한 데이터 관점의 업무 분석 기법
4) 현실세계의 데이터(what)에 대해 약속된 표기법에 의해 표현하는 과정
5) 데이터 베이스를 구축하기 위한 분석/설계의 과정
나. 데이터 모델이 제공하는 기능
- 시스템을 현재 또는 원하는 모습으로 가시화
- 시스템의 구조와 행동을 명세화
- 시스템 구축하는 구조화된 틀 제공
- 구축 과정의 결정을 문서화
- 다양한 영역에 집중하기 위해 다른 세부 사항을 숨기는 관점 제공
- 특정목표에 따라 구체화된 상세 수준의 표현방식 제공
3. 데이터 모델링의 중요성 및 유의점
가. 파급효과
이후의 과정에서 변경사항에 대응하는 유연성에 따라서 영향분석이 달라지기 때문에
구조변경 작업은 전체 시스템 구축 프로젝트의 큰 위험요소임으로 데이터 설계가 더 중요하다.
나. 복잡한 정보 요구사항의 간결한 표현
가장 명확하고 간결하게 표현할 수 있는 도구로써 간결하게 그려져 있는 데이터 모델을 리뷰하면서 정보 요구사항 파악 가능
다양한 사람들의 정보요구사항을 이해, 운용하고 데이터 정합성을 유지한다.
다. 데이터 품질
데이터베이스의 담긴 데이터는 기업의 중요한 자산이다.
오랜기간 숙성된 데이터를 전략적으로 활용하려는 경우 문제점이 발생되기 때문에 설계를 잘 해야 한다.
<데이터 구조의 문제>
- 중복 : 여러 장소에 같은 정보를 저장하지 않음
- 비유연성 : 데이터 정의를 데이터 사용 프로세스와 분리함으로써 작은 변화가 앱과 데이터 베이스에 중대한 변화를 일으킬 가능성 줄임
- 비일관성 : 데이터간 상호 연관 관계에 대한 명확한 정의가 필요함
4. 데이터
모델링의 3단계 진행
가. 개념적 데이터 모델링
- 추상화 수준이 높고 업무중식적이고 포괄적인 수준의 모델링을 진행
- 데이터 요구사항을 찾고 분석하는 것 부터 시작하며, 핵심 엔티티와 그들간의 관계를 발견하고 관계 다이어그램으로 생성
- 전사적 데이터 모델 (EDM)을 만들고 데이터 요구를 공식화 함
- 데이터 요구 사항을 발견 → 논의할 수 있는 기반을 만듬
- 어떻게 변형되어야 하는지 이해하는데 유용
나. 논리적 데이터 모델링
- 가장 핵심이 되는 부분, 시스템 설계의 전 과정을 지원하는 '과정의 도구'
- 정규화 : 일관성 확보, 중복제거 하여 적절한 엔티티 배치 → 신뢰성있는 데이터구조
- 상세화 : 식별자 확정, 정규화, M:M 관계 해소, 참조 무결성 규칙 정의
- 시스템 구축하고자 하는 업무에 대해 key, 속성, 관계 등을 정확하게 표현, 재사용성이 높다.
- 논리적 구조와 규칙을 명확하게 표현하는 기법, 과정
- 데이터 엑세스 : 누가, 어떻게 그리고 독입적인 비즈니스 데이터에 존재하는 사실들을 인식하여 기록한다.
다. 물리적 데이터 모델링
- 실제로 데이터 베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계
- 저장소로써 어떻게 하드웨어에 표현될것인가,
- 물리적 스키마 : 물리적으로 어떻게 저장될 것인가에 대한 정의 ← 물리적 저장구조(테이블, 칼럼) + 접근 방법(자료 추출)
5. 프로젝트 생명주기에서 데이터 모델링
6. 데이터
모델링에서 데이터 독립성의 이해
가. 데이터 독립성의 필요성
- 독립적 의미를 부여하고 효과적으로 구현하면 자신이 가지는 고유한 특징을 명확하게 하고 다른 기능으로 부터 쉽게 변경되지 않는 고유 기능 가지며 제공 가능
- ↔ 데이터 종속성 : 종속의 주체 응용(사용자 요구사항을 처리하는 사용자 접점의 인터페이스 오브젝트), 사용자 접근에 따라 구성방법 영향을 쉽게 받음
- 유지보수 비용 절감
- 데이터 복잡도 낮춤
- 데이터 중복성 제거
- 요구사항 대응 (화면과 데이터베이스 간의 서로 독립성을 유지)
- 효과 : view 독립성 유지, 단계별 스키마에 따라 DDL, DML 다름 제공
나. 데이터 베이스의 3단계 구조
- 외부단계 : 개개인이 보는 자료에 대한 관점과 관련있는 스키마 구조 데이터 유형의 공통적인 사항을 처리하는 통합된 뷰를 스키마 구조로 디자인
- 내부단계 : 데이터가 물리적으로 저장된 방법에 대한 스키마 구조
다. 데이터 독립성 요소
각각 상호 독립적인 의미를 가지고 고유의 기능을 가짐
항목
|
내용
|
비고
|
외부 스키마
|
- View 단계 여러개의 사용자 관점으로 구성
- 개개인 사용자 단계로서 보는 개인적 DB 스키마
- DB의 개개인 사용자나 응용프로그래머가 접근하는 DB정의
|
사용자 관점에서
접근하는 특성에
따른 스키마 구성
|
개념 스키마
|
- 개념 단계의 하나의 스키마로 구성
- 모든 사용자 관점을 통합한 조직 전체의 DB를 기술
- 모든 시스템, 사용자들이 필요호 하는 데이터를 통합한 DB
- DB내에 저장되는 데이터와 그들간의 관계를 표현하는 스키마
|
통합관점
|
내부 스키마
|
- 내부단계, 내부 스키마로 구성,
- DB가 물리적으로 저장된 형식
- 물리적 장치에서 실제적으로 저장되는 방법을 표현하는 스키마
|
물리적 저장 구조
|
라. 두 영역의 데이터 독립성
- 논리적 독립성 : 외부 변경에도 개념 스키마가 변하지 않음, 개념스키마 변경되어도 외부 스키마에는 영향이 없음
논리적 구조가 변경되어도 응용프로그램에 영향 없음
사용자 특성에 맞는 변경 가능, 통합 구조 변경가능
- 물리적 독립성 : 내부스키마가 변경되어도 외부/개념 스키마는 영향받지 않음
저장장치의 구조변경은 응용프로그램과 개념스키마에 영향이 없음
물리적 구조 영향없이 개념구조 변경 가능하고 개념구조 영향없이 물리적 구조 변경 가능
마. 사상 : 상호 독립적인 개념으로 연결시켜주는 다리
- 외부적/개념적 사상(논리적 사상) : 외부적 뷰와 개념적 뷰의 상호 관련성을 정의함
- 개념적/내부적 사상(물리적 사상) : 개념적 스키마 구조와 물리적으로 저장된 구조의 물리적인 테이블스페이스와 연결되는 구조
7.데이터 모델링의 중요한 3 가지 개념
가. 데이터 모델링의 3가지 요소
- Things : 업무가 관여된 어떤것, 사물이나 사건의 전체
- Attributes : 어떤 것이 가지는 성격, 세부적인 사항
- Relationships : 업무가 관여하는 어떤 것 간의 관계, 연관성
나. 단수와 집합(복수)의 명명
8. 데이터
모델링의 이해관계자
가. 이해관계자의 데이터 모델링 중요성 인식
나. 데이터 모델링의 이해관계자
- 정보시스템을 구축하는 모든 사람 : 프로젝트 참여한 모든 사람
- 정보화 추진하는 위치에 있는 현업 전문가
9. 데이터
모델의 표기법인 ERD의 이해
가. 데이터 모델 표기법
: Entity - relationship Model 1976년 피터첸이 만듬
나. Entity Relationship
Diagram 표기법을 이용하여 모델링 하는 법
해당 업무에서 데이터의 흐름과 프로세스의 연관성을 이해하는 가장 중요한 표기법이자 산출물
- 작업순서
- 엔티티를 그린다
- 엔티티를 적절하게 배치한다.
- 엔티티간 관계를 설정한다.
- 관계명을 기술한다.
- 관계의 참여도를 기술한다.
- 관계의 필수여부를 기술한다.
- 엔티티 배치 : 가장 중요한 엔티티를 왼쪽 상단에 배치하고 이것을 중심으로 나열
업무흐름에 중심이 되는 엔티티는 중앙에 배치
중심엔티티과 관계를 갖는 엔티티를 중심 주위에 배치한다.
- ERD 관계의 연결 : 엔티티간의 관계를 설정, 식별자나 중복 확인
- 관계명 표시 : 관계이름 부여, 현재형을 사용하고 포괄적인 용어는 사용하지 않음
- 관계차수와 선택성 표시 : 얼마나 관계에 참여하는지 나타냄
10. 좋은 데이터 모델의 요소
가. 완전성 : 모든 데이터가 데이터 모델에 정의 되어야 한다.
나. 중복배제 : 동일한 사실은 반드시 한 번만 기록, 예를 들어 생일과 나이 컬럼은 하나만
다. 업무규칙 : 업무규칙을 모델에 표현하고 해당 모델을 활용하는 모든 사용자가 공유할 수 있도록 제공
라. 데이터 재사용 : 통합성과 독립성을 고려하여 통합모델로 만들어야함, 데이터 구조의 확장성, 유연성, 안정성지키고 합리적으로 균형있게 단순한 분류 필수
마. 의사소통 : 관련자들이 업무규칙을 동일한 의미로 받아드리고 활용하도록 진정한 의사소통의 도구로의 역할 담당
바. 통합성 : 전체 조직 통합시, 동일한 데이터는 조직에 한번만 정의되고 여러 영역에서 참조, 활용되도록