자료 처리
자료와 정보
- 자료(Data) : 현실 세계로부터 단순한 관찰이나 측정을 통하여 수집된 사실이나 값
- 정보(Information) : 자료를 처리하여 얻은 결과로서, 의사 결정을 하기 위한 값
정보 시스템
- 한 조직체의 데이터를 바탕으로 의사 결정에 필요한 정보를 추출하고 생성하는 시스템
- 사용 목적에 따라 인사 정보 시스템, 행정 정보 시스템 등으로 구분
자료 처리 시스템의 종류
- 일괄 처리 시스템 : 일정 시간 동안 수집된 변동 자료를 컴퓨터의 입력 자료로 만들었다가 필요한 시점에 이 자료들을 입력하여 실행한 후 그 결과를 출력시켜 주는 방식의 시스템
- 예) 급여 관리, 세무 관리
- 온라인 처리 시스템 : 자료 발생 즉시 해당 자료를 처리하여 결과를 출력시켜 주는 방식의 시스ㅡ템
- 예) 좌석 예약, 주식 거래
- 분산 처리 시스템 : 물리적으로 분리된 각각의 데이터베이스를 네트워크로 연결하여 실사용자들이 각 시스템이 하나인 것처럼 사용할 수 있도록 지원해주는 시스템
데이터베이스(Database)의 정의
- 통합된 데이터(Integrated Data) : 각 사용자의 데이터를 한 곳에 모아 통합한 데이터
- 저장된 데이터(Stored Data) : 데이터베이스는 컴퓨터 하드웨어 저장 장치에 저장되어 있는 데이터
- 운영 데이터(Operational Data) : 데이터베이스는 어떤 조직의 고유 기능을 수행하기 위해 반드시 필요한 데이터
- 공용 데이터(Shared Data) : 데이터베이스를 여러 사용자가 공동 소유 · 관리 · 활용하는 데이터
데이터베이스의 특성
- 실시간 접근성(Real Time Accessibility) :수시적이고 비정형적인 질의에 대하여 실시간 처리롤 응답할 수 있어야 함
- 내용에 의한 참조(Content Reference) : 데이터베이스의 데이터는 그 주소나 위치에 의해 참조되는 것이 아니라 내용을 참조함
- 동시 공유(Concurrent Sharing) : 같은 내용의 데이터를 여러 사람이 동시에 공용할 수 있음
- 계속적 변화(Continuous Evolution) : 데이터베이스는 데이터의 삽입, 삭제, 갱신으로 내용이 계속적으로 변함
데이터베이스 시스템의 구성
- DBMS, 스키마, 데이터베이스 언어, 데이터베이스 사용자
DBMS(DataBase Management System, 데이터베이스 관리 시스템)
- 종속성과 중복성의 문제를 해결하기 위해 제안된 시스템
- 응용 프로그램과 데이터의 중재자로서 모든 응용 프로그램들이 데이터베이스를 공유할 수 있도록 관리함
- 데이터베이스의 구성, 접근 방법, 관리 유지에 대한 모든 책임을 짐
DBMS의 필수 기능
- 정의 기능(Definition Facility)
- 데이터베이스 구조를 정의함
- 데이터의 논리적 구조와 물리적 구조 사이에 변환이 가능하도록 두 구조 사이의 사상(Mapping)을 명시함
- 조작 기능(Manipulation Facility)
- 데이터베이스에 접근하여 데이터의 검색/삽입/삭제/갱신 등의 연산작업을 하기 위한 사용자와 데이터베이스 사이의 인터페이스 수단을 제공함
- 제어 기능(Control Facility)
- 데이터베이스에 접근하는 갱신, 삽입, 삭제 작업이 정확하게 수행되어 무결성이 유지되도록 제어해야 함
- 정당한 사용자가 허가된 데이터만 접근할 수 있도록 보안(Security)을 유지하고, 권한(Authority)을 검사할 수 있어야 함
- 여러 사용자가 데이터베이스를 동시에 접근하여 데이터를 처리할 때 처리 결과가 항상 정확성을 유지하도록 병행 제어를 할 수 있도록 함
DBMS의 장·단점
장점 | - 데이터 중복 및 종속성 최소화 - 데이터 공유 - 데이터 무결성 및 일관성 유지 - 데이터 보안 보장 용이 |
단점 | - 예비와 회복 기법이 어려움 - 데이터베이스 전문가 부족 - 시스템이 복잡하고, 전산화 비용 증가 |
데이터웨어하우스(Data Warehouse)
- 기간 업무 시스템에서 추출되어 새로이 생성된 데이터베이스로서 의사결정 지원을 위한 주제 지향적, 통합적, 시계열적(Historical), 비휘발적인 데이터의 집합
- OLAP(On-Line Analytical Processing) : 대용량 데이터를 고속으로 처리하며 쉽고 다양한 관점에서 추출, 분석할 수 있도록 지원하는 데이터 분석 기술
- OLAP 연산 종류 : Roll-Up, Drill-Down, Dicing, Slicing
데이터베이스 용어
- 빅데이터 : 데이터의 생성 양, 주기, 형식 등이 기존 데이터에 비해 매우 크기 때문에, 종래의 방법으로는 수집·저장·검색·분석이 어려운 방대한 데이터
- 데이터 마이닝 : 데이터웨어하우징에서 수집되고 분석된 자료를 사용자에게 제공하기 위해 분류 및 가공되는 요소 기술
- Hadoop : 일반 컴퓨터로 가상화된 대형 스토리지를 구현함. 그 안에 보관된 거대한 데이터 세트를 병렬로 처리할 수 있도록 빅데이터 분산 처리를 돕는 자바 기반 소프트웨어 오픈소스 프레임워크
728x90
반응형
'정보처리기사 > 데이터베이스 구축' 카테고리의 다른 글
관계형 데이터베이스 모델 (0) | 2023.07.14 |
---|---|
데이터베이스의 구성, 모델 (0) | 2023.07.14 |
인덱스 구조와 파일 편성 (0) | 2023.07.14 |
검색과 해싱 (0) | 2023.07.14 |
정렬 (0) | 2023.07.14 |