노력에는 지름길이 없으니까요

2-1) 모델링의 이해와 중요성 본문

SQLD

2-1) 모델링의 이해와 중요성

데건 2024. 7. 17. 20:50
728x90

모델링의 이해

모델링의 정의

 

데이터 모델은 데이터를 기반으로 한 모델링의 과정.

modeling -> 데이터베이스의 형식을 만드는 것!

현실 세계를 얼마만큼 추상화시켜 표현할 것인지 그림을 그리는 과정이고 그 결과를 토대로 세상을 단순화 시켜 명확하게 바라볼 수 있게 됩니다.

데이터 모델은 데이터베이스의 큰 그림을 이해하고 그걸 바탕으로 SQL 문장을 작성하는데 필요한 매우 중요한 요소.

데이터 모델을 잘 설계한다? 즉, 데이터베이스를 제대로 만든다.

 

 

☑️ 데이터 모델링의 정의

  • 정보 시스템 구축을 위해 데이터 관점의 업무를 분석하는 과정
  • 현실 세계의 데이터를 약속된 표기법에 의해 표현하는 과정
  • 데이터베이스를 구축하기 위한 분석 및 설계의 과정

 

데이터 모델링의 목적

    1. 업무에 필요한 정보를 정확하게 '정의'하고 '표현'하여 업무를 분석 → 개발하기 위해서만 데이터 모델링을 하는 것이 아님 !
    2. 분석 모델을 통해 실제 데이터베이스를 생성하여 데이터를 관리

 

☑️ 데이터 모델이 제공하는 기능

시각화 시스템을 원하는 모습으로 시각화해서 보여줄 수 있도록 한다
문서화 시스템의 구조와 행동을 문서화한다
구체화 특정한 목표에 따라 구체화된 상세 수준의 표현 방법을 제공한다
구조화된 틀 제공 시스템을 구축하는 구조화된 틀을 제공한다
다양한 관점 제공 다양한 영역에 집중하기 위해 다른 영역의 세부 사항은 숨기는 다양한 관점을 제공한다

 

  • 데이터 모델은 데이터베이스의 큰 그림을 이해하고 그걸 바탕으로 SQL 문장을 작성하는데 필요한 매우 중요한 요소입니다. 데이터 모델에 대한 이해가 잘 되어 있으면 단순한 기능을 사용하는 것뿐만 아니라 성능적인 측면도 고려하여 SQL문을 작성할 수 있기 때문입니다. 이는 설계 도면을 기반으로 집을 짓는 것과 같고 목차를 통해 책의 전체 구조를 먼저 파악하는 것과 같은 이치입니다. 현업에서 SQL을 사용하는 과정도 SQL 문장을 어떻게 구성할지에 대한 지식과 효율적인 구성에 대한 지식이 필수적이기 때문에 모델링을 올바른 관점으로 바라보고 구성하는 것은 매우 중요합니다. 일반적으로 데이터 모델링은 다음과 같이 다양하게 정의합니다.
  • 데이터 모델은 데이터를 기반으로 한 모델링의 과정이라고 할 수 있습니다. 결국 모델을 만드는 과정인 모델링은 현실 세계를 얼마만큼 추상화시켜 표현할 것인지 그림을 그리는 과정이고 그 결과를 토대로 세상을 단순화 시켜 명확하게 바라볼 수 있게 됩니다. 모델링은 모두 데이터를 기반으로 행해집니다. 세상에 존재하는 모든 것은 데이터로 표현 가능하고 그 데이터를 모아 구조화하고 집약하는 작업이 모델링이기 때문입니다.
  • 데이터베이스에서의 모델은 데이터베이스 관리 시스템(RDBMS)이 지원하는 데이터베이스의 구조나 형식을 의미합니다. 즉, 관리하는 데이터에 대한 청사진이며 우리는 모델 정보(구조)만 보고도 어떤 데이터를 다루는지 알 수 있습니다.

모델링의 특징

추상화 (Abstraction) 현실 세계를 일정한 형식에 맞추어 표현하는 것
모델링은 세상에 존재하는 수많은 대상을 특정한 기준에 따라 나누고 나뉜 기준의 상위 기준을 모아서 또 다른 기준으로 구분하여 나누는 과정을 반복합니다. 위와 같은 과정을 계속 따라갔을 수많은 요소를 하나의 문장, 단어, 개념으로 표현할 수 있는 순간에 도달하게 되는데, 이는 결국 모델링을 통한 추상화 과정이라고 볼 수 있습니다.
단순화  (Simplification) 복잡한 현실 세계를 약속된 규칙에 기반한 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 하는 것
현실 세계에 존재하는 수많은 요소를 정확하게 분류하여 나누고 구분하는 것은 현실적으로 불가능합니다. 모델링은 복잡한 세상을 단순화 시킬 수 있도록 구조화합니다.
명확화  (Clarity) 명확화는 누구나 이해하기 쉽게 대상에 대한 애매모호함을 제거하고 현상을 정확하게 기술하는 것을 의미합니다. 현실 세계에 존재하는 데이터를 정리하고 단순화 시키는 과정에서 한 대상이 갖는 의미를 명확하게 기술합니다. 모델링의 과정 속에는 대상을 명확화하고 구체화 시키는 과정 뿐만 아니라 그 대상을 어떻게 표기하고 기술할 것인지를 고민하는 과정이 포함되며 이는 명확성을 증가시키는 과정이라고 볼 수 있습니다.

 

 

데이터모델링 3단계 진행

 

데이터모델링의 단계

설명

 

개념적 데이터 모델링 Conceptual Data Modeling
- 조직이나 사용자가 필요로 하는 데이터의 요구사항을 찾고 분석하는 과정 - 복잡하지 않고 중요한 부분을 위주로 모델링하는 단계 - 추상화 수준이 가장 높고 업무 중심적인 모델링 - 전사적 관점에서 기업의 데이터 모델링
논리적 데이터 모델링 Logical Data Modeling
- 비즈니스 과정에서 나타나는 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법/과정 - 누가(Who), 어떻게(How: Process) 그리고 전산화와는 별개로 비즈니스 데이터에 존재하는 사실을 인식하여 기록하는 것 - 정규화*를 수행하여 데이터 모델의 독립성 확보 *정규화 : 논리 데이터 모델의 일관성을 확보하고 중복을 제거하여 보다 신뢰성 있는 데이터 구조를 얻는 방법
물리적 데이터 모델링 Physical Data Modeling
- 논리적 데이터 모델이 데이터 저장소로서 어떻게 컴퓨터 하드웨어에 표현될 것인지를 다루는 과정 - 구축할 데이터베이스 관리 시스템에 테이블, 인덱스 등을 생성하는 단계 - 성능, 보안, 가용성을 고려하여 구축

 

☑️ 데이터모델링의 관점

업무 상황에서 훨씬 더 정제되고 일관적인 데이터 수집이 가능하기 때문에 모델링은 일상보단 업무적인 환경에서 더 많이 사용합니다. 그렇기 때문에 관련된 용어들이 업무적인 환경과 더 깊이 연결되어 있는 경우가 많습니다. 이러한 관점에서의 모델링은 시스템의 대상이 되는 업무를 분석하여 정보 시스템으로 구성하는 과정에서 업무의 내용과 그 모습을 적절한 표기법(Notation)으로 표현하는 것을 의미합니다.

이번에는 모델링된 결과물을 바라보는 3가지 관점인 데이터 관점, 프로세스 관점, 데이터와 프로세스의 상관관점에 대해서 알아보겠습니다.

 

 

데이터 모델링의 중요성

  • ☑️ 파급효과 (Leverage)
  • 구체적인 내용은 변해도 큰 구조는 변하지 않도록 만드는 것
  •  
  • ☑️ 간결한 표현 (Conciseness)
  • 시스템의 정보에 대한 요구 사항과 한계점을 가장 명확하고 간결하게 표현할 수 있는 도구
  • 데이터 모델이 갖추어야 할 가장 중요한 점은 정보 요구 사항이 정확하고 간결하게 표현되어야 한다는 것
  •  
  • ☑️ 데이터 품질 (Data Quality)
  • ⓵ 중복 (Duplication)
  • ◦ 데이터베이스 여러 곳에 같은 정보를 중복해서 저장하는 행위입니다.
  • ⓶ 비유연성 (Inflexibility)
  • ◦ 환경이 바뀌었을 때 데이터가 사용 가능 여부입니다.
  • ◦ 데이터 모델을 어떻게 설계했느냐에 따라 사소한 업무의 변화에도 데이터 모델의 유지 보수가 쉬울 수도 있고 어려울 수도 있습니다.
  • ⓷ 비일관성 (Inconsistency)
  • ◦ 데이터의 중복이 없다고 해도 일관적이지 않은 데이터가 나타날 수 있습니다.
  • ◦ 데이터 모델링을 할 때는 데이터와 데이터 간의 상호 연관 관계에 대한 명확한 정의를 해야 할 필요가 있습니다.

좋은 데이터 모델링을 하기 위해서는?프로젝트 라이프 사이클을 사용함

프로젝트의 시작부터 완료에 이르기까지 거치는 일련의 단계를 의미

프로젝트 관리 방법론에는 크게 폭포수 모델(Waterfall)과 애자일 모델(Agile)

프로젝트의 범위가 명확할 때 폭포수 방법론(Waterfall)을 적용합니다.

 

3층 스키마 (3-Level Schema)

데이터 모델링의 과정에서 신경 써야 하는 것 중 하나는 데이터의 일체적 구성입니다. 일체적 구성이라고 하는 것은 일관된 형태로 데이터를 수집하는 것입니다. 다른 말로 표현하자면 데이터의 독립적 구성이라고 할 수 있습니다.

 

 

→ 응용 프로그램과 물리적 데이터베이스를 분리하자 ! 👀

 

 

 3층 스키마란?

3층 스키마란, 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들간의 관계를 정의한 ANSI 표준

3단계 계층으로 분리하여 독립성을 확보해 각 계층을 뷰(View)

사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 표준

 

→ 유저 어플리케이션(프로그램)은 데이터베이스 시스템의 최상위 단계

물리적 데이터베이스는 최하위에 위치

이 사이를 세 개의 단계(스키마)로 나눠보자는 것 👀

 

✔️조금 더 쉽게 이해해보자

  • 데이터베이스를 3가지의 큰 범주로 분리해보자라는 컨셉
  • 사상(mapping)은 각 각의 범주간의 요청/응답을 전송하는 것 (외부스키마와 개념스키마가 통신하게끔 하는 것)
  • 외부 스키마에서 요청이 들어오면 DBMS에 의해 개념 스키마 - 내부 스키마로 전달됨 여기에서 요청과 응답을 변환하는 프로세스를 사상(mapping) 이라고 함

 

  • 내부 스키마 (데이터베이스 그 자체, 물리적인.)
    • 물리적 저장 구조를 갖춘 모델
  • 개념 스키마 (데이터베이스를 추상화한 단계)
    • 전체 데이터베이스의 설계를 설명할 수 있는 모델 (구조, 관계등)
    • 데이터 구조의 구현 정보와 같은 내부 상세 정보는 보지 못함

 

층을 나누는 이유? 독립성을 확보하기 위해

데이터 독립성 (Data Independence)

  • 상위 스키마를 변경하지 않고 하나의 계층에서 스키마를 변경할 수 있는 능력
  • 데이터베이스의 여러 레벨에서 구조를 수정할 때, 하위 레벨 스키마를 변경하더라도 상위 레벨의 스키마를 건드릴 필요가 없는 것 (영향을 미치지 않음)

 

  • 논리적 독립성
    • 우리가 데이터 저장이 필요한 속성을 추가/변경이 필요할 때 외부 응용 프로그램을 변경하지 않아도됨
  • 물리적 독립성
    • 실제로 데이터를 저장하는 위치나 파일 이름을 변경하더라도 데이터베이스 전체 관점 즉, 개념 스키마 관점에서는 아무런 영향이 없음

 

데이터 모델링의 요소와 ERD

☑️ 데이터 모델링의 중요한 3가지 개념

엔터티(Entity) - 업무가 관여하는 어떤 것(thing)

속성(Attribute) - 어떤 것이 갖는 성격 (엔터티의 특징)

관계(Relationship) - 업무가 갖는 어떤 것 간의 관계 (엔터티와 엔터티간의 관계)

 

 

☑️ERD란?

Entity Relationship Diagram.

데이터들의 관계를 나타낸 도표

 

 

 

 

 

 

 

 

728x90
반응형

'SQLD' 카테고리의 다른 글

SQLD 3-1) 엔티티 (Entity)  (0) 2024.07.31
1) 데이터와 데이터베이스  (0) 2024.07.16