본문 바로가기

Hello World!!/Database

데이터베이스 환경 (1)

1. 정보 처리 시스템


ο 정보 처리 (Information Processing) : 컴퓨터가 정보를 생성하기 위해 데이터를 처리하는 작업을 말한다.


ο 데이터 (Data) : 현실 세계에서 단순한 관찰이나 측정을 통해서 수집된 사실(Fact) 이나 값(Value)을 말한다.


ο 정보 (Information) : 적절한 결정(Decision Making)을 할 수 있게 하는 지식(Knowledge)으로서 데이터의 유효한

해석(Interpretation)이나 데이터 상호 간의 관계(Relationship)를 말한다.


데이터 (D) → 처리기(P) → 정보(I)


I = P(D)


ο 데이터 처리 / 정보 처리 : 정보 추출 방법이다.


ο 정보정확성(Accuracy)현재성(Currency)을 가지고 있어야 한다.


ο 정보 시스템 (Information System) - 컴퓨터 중심


- 한 조직체의 활동에 필요한 데이터를 수집, 조직, 저장해 두었다가 필요시에 처리해서 의사 결정에 유효한 정보를

  생성하여 분배하는 수단


① 내부적 운영, 외부적 상황에 관려 된 과거, 현재, 그리고 예측되는 미래 상황에 대한 정보를 체계적으로 제공하는 방법


② 의사 결정 과정에서 적시에 정확한 정보를 제공함으로써 그 조직체의 관리, 즉 기획, 통제 그리고 운영 기능을 조정하는 역할도 한다. → 경영 정보 시스템 (MIS)


* 의사 결정 지원 시스템 (DDS : Desicion Support System)

 - 하나의 전문적인 목적보다는 여러가지 복합적이고 광범위한 의사 결정 목적


ο 데이터 웨어하우스 (Data Warehouse)


- 다양한 소스의 데이터를 별도로 추출하여 관리하는 것


ο 데이터 마이닝 (Data Mining)


- 관련 된 데이터를 별도로 추출하고 필요한 정보 또는 지식을 생성하는 과정


ο 지식 관리 시스템 (Knowledge Management System)


- 데이터에서 한 단계에 수준 높은 지식을 직접 저장하고 관리하여 활용



2. 데이터 처리 시스템


ο 일괄 처리 시스템 (Batch Processing System)


- 데이터를 수집해서 분류하고 정렬시킨 다음에 일괄 처리하는 데이터 처리 시스템


* 트랜잭션 (Transaction) : 논리적 작업 단위, 하나의 단위로 처리되어야 하는 분리될 수 없는 연산 그룹


예) 급여 명세서, 납세 고지서


- 순차 접근 방법(Sequential Access Method)를 사용할 수 있는 업무에 적합


- 장점 : 처리 비용이 적게 든다. 단위 시간 당 작업 수 ↑ 시스템 성능 ↑


- 단점 : 개인적인 처리 결과를 위해서는 대기, 여러 가지 사전 준비 작업이 필요


원시데이터 (Raw Data) → 분류 및 정리 → 컴퓨터 → 보고서

      ↕

      파일

일괄 처리 시스템의 작업 과정


ο 온라인 처리 시스템 (On-line Processing System) - 사용자 중심


- 사전 준비 작업 없이 곧바로 데이터를 처리하는 방식


- 데이터 처리를 위한 대기 시간이 없음


- 데이터의 현재성을 편리하게 유지 → 효과적인 데이터 처리 결과 제공


- 원격 터미널 (Remote Terminal)들과 계속적으로 통신을 유지해야 되고 이를 위한 통신 제어기 (Communication Controller)가 필요 → 구조가 복잡


- 응답 시간 (Response Time) 최소 특성 때문에 작업량이 많지 않을 경우 효율성↓ → 작업 당 처리 비용↑


ο 분산 처리 시스템 (Distributed Processing System)


 - 지리적(물리적)으로 분산되어 있는 처리기와 데이터베이스를 네트워크로 연결시켜 마치 (논리적으로) 하나의 시스템을 사용하는 것처럼 데이터를 처리해 주는 시스템.


- 구성요소 : 분산 처리기, 통신 네트워크, 분산 데이터 베이스


- 분산 처리기 : 지리적으로 분산 설치 되어 있는 복수의 컴퓨터


- 통신 네트워크 : 처리기들을 연결시켜 자원 공유하게 함으로써 논리적으로 하나의 시스템과 같이 운영되도록 하는 네트워크


- 분산 데이터 베이스 : 데이터가 지리적으로 분산 저장되어 있는 형태의 데이터베이스


- 서버 : 데이터 처리 / 전송     - 클라이언트 : 데이터요청


3. 데이터베이스의 정의


ο 어느 한 조직의 여러 응용 시스템들이 공유할 수 있도록 통합, 저장된 운영 데이터 집합


ο 함축 된 의미


① 통합 데이터 (Integrated Data)


- 똑같은 데이터가 원칙적으로 중복되어 있지 않다는 것을 말한다.


- 데이터 중복 (Data Redundancy)은 부작용을 초래 한다.


- 효율성을 위해 중복을 허용하기도 한다. 이러한 중복은 의도적이여서 항상 파악이 가능하고 관리할 수 있다. 이것을 최소의 중복 (Minimal Redundancy) 또는 통제된 중복 (Controlled Redundancy) 라고 한다.


② 저장 데이터 (Stored Data)


- 컴퓨터가 접근할 수 있는 저장 매체에 저장된 데이터


③ 운영 데이터 (Operational Data)


- 고유의 기능을 수행하기 위해 반드시 유지되어야 될 데이터


④ 공용 데이터 (Shared Data)


- 조직에 있는 여러 응용 시스템들이 공동으로 소유하고 유지하며 이용하는 데이터



4. 데이터베이스의 특성


① 실시간 접근성 (Real-time Accessibility)


② 계속적인 변화 (Continuous Evolution)


- 데이터베이스의 상태는 동적. 항상 내용이 변할 뿐 아니라 현재의 정확한 데이터를 유지


③ 동시 공유 (Concurrent Sharing)


- 여러 사용자가 동시에 자기가 원하는 데이터에 접근하여 이용할 수 있어야 한다.


④ 내용에 의한 참조 (Contents Reference)


- 사용자가 요구하는 데이터의 내용, 즉 데이터 값에 따라 참조