데이터 입출력 구현


데이터 모델 : 현실세계의 정보를 인간과 컴퓨터가 이해할수 있도록 추상화하여 표현한 모델

데이터 모델 절차 : 요구사항 분석 -> 개념적설계(E-R) -> 논리적설계 -> 물리적 설계  ( 기출 21-1)

 

 

 

논리 데이터 모델링: 사람이 이해하기 쉽게 표현

논리 데이터 모델링 종류

       관계 데이터 모델: 테이블형태, 1:1, 1:N, N:M

       계층 데이터 모델 : 트리형태(상하) , 1:N

       네트워크 데이터 모델 : 그래프형태 , N:M

 

튜플 : 행 , 튜플의 수는 카디널리티,기수

속성 : 열 , 속성의 수는 디그리 혹은 차수 , 하나의 속성이 취할 수 있는 같은 타입의 원자값들의 집합은 도메인

 

 

정규화와 이상현상


이상현상 : 데이터 중복성으로 인해 릴레이션을 조작할때 발생하는 비합리적 현상 ( 기출)

      삽입이상 : 불필요한 세부정보 입력 , 삽입될 값이 없을 때

       삭제이상 : 다른정보도 삭제

      갱신이상 :  중복을 포함하면서 수정되어 다른 항목까지 수정되어야할 때

 

이상이 발생하면 여러개의 릴레이션으로 분해 -> 정규화(정보의 중복을 배제하여 이상의 발생 방지)

정규화 : 데이터 모델에서 중복성제거 데이터 일관성 정확성 유지 무손실 분해과정

 

정규화 단계

      1정규형 : 원자값이 아닌 도메인 분해

      2          : 부분한수 종속제거(완전 함수적 종속만족)

      3          : 이행함수 종속제거

      보이스 코드 정규형 : 결정자가 후보 키가 아닌 함수 종속 제거

      4정규형 : 다치 종속성 제거

      5 정규형 : 조인종속 

 

반(비)정규화 : 성능향상과 단순화를 위해 중복 통합 분리를 수행하는 데이터 모델링 기법  (기출) (기출 21-1)

 

수직 분할 , 수평 분할 

 

뷰 : 가상의 테이블

시스템 카탈로그 : 스키마 및 객체에 관한 정보를 포함하고 있는 시스템 데이터베이스(갱신 불가)

 

ODBC : 데이터베이스 접근 api

JDBC : 자바 api

 

절차형 sql :PL/SQL

스토어드 프로시저 : 데이터베이스 시스템 처리속도 고도화기법

트리거 : 삽입,수정,제거 발생시 DBMS 실행 프로시저 

 

SQL


DDL 데이터 정의어 

         CREATE TABLE 테이블 명  , ALTER TABLE , DROP TABLE

 

DML 데이터 조작어

         SELECT FROM , INSERT INTO VALUES , DELETE FROM , UPDATE SET 

 

DCL 데이터 제어어

         GRANT , REVOKE , ROLL

 

TCL 트랙잭션 제어어

         COMMIT(결과를 물리적 디스크에 저장하고 성공적이라고 알림)

         ROLLBACK

        SAVEPOINT

 

SQL PLUE : SQL실행시 볼수 있는 툴 

 

튜닝 : 최적화

로우 마이그레이션 : 데이터를 다른 블록에 성능저하

로그 체이닝 : 두개의 블랙에 성능 저하

 

인덱스 : 데이터에 빠르게 접근하기 위해 키값,포인터   쌍으로 되는 데이터구조

            클러스터드 인덱스: 인덱스 키의 순서에 따라 데이터 정렬

           넌 클러스터드 인덱스 : 인덱스의 키값만 정렬되고 데이터는 실제 정렬 x

 

트랜잭션의 특징

          원자성 : 수행이 완료되지 않으면 전혀 수행되지 않아야한다.

          일관성 : 시스템 고정요소는 수행 전후가 같아야한다.

          격리성 : 다른 트랜잭션의 간섭을 받지 않아야 한다. 

          영속성 : 결과가 데이터베이스가 영구히 기억되어야한다. 

 

기아현상 : 하나는 실행되지않는것.

 

로킹 : LOCK을 획득 시 에만 사용 가능 하게  , 2단계 로킹

 

 

파티션 : 대용량의 테이블, 인덱스를 작은 논리적 단위인 파티션으로 나누는것

      수평파티셔닝 : 각행을 분산

      수직파티셔닝 : 컬럼을 분할

      범위분할 : 지정한 열의 값을 기준으로 분할

      해시분할 : 해시 함수결과값에 따라

      리스트분할 : 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능

      조합분할 : 범위,해시,리스트분할중 2개이상의 파티셔닝을 결합하는 방식 파티션이 클때 사용

 

 

 

 

 

 

관계 대수 : 관계형 데이터베이스 절차적 정형 언어

관계 대수 연산자

          일반 집합 연산자 

                     합집합, 교집합 ,차집합 , 카디션 프로덕트(X)

           순수 관계 연산자

                     셀렉트, 프로젝트(ㅠ) , 조인 , 디비전

 

관계 해석 : 튜플 관계해석과 도메인 해석 비절차적 언어

논리데이터 모델링 속성 : 개체, 속성, 관계

개체-관계 모델 : 데이터과 관계를 사람이 이해할수 있게 표현한 모델

 

 

참조무결성 제약조건 : 릴레이션간 참조의 일관성

          제한 : 다른테이블이 삭제할 테이블을 참조중이면 제거 x

          연쇄 : 참조하는 테이블까지 제거

           널값 : 참조되는 릴레이션에서 튜플 제거 , 참조하는 튜플들의 외래값에  null

 

 

파티션 장점 : 성능 향상 ,가용성 향상, 백업 가능, 경합 감소

 

 

데이터베이스 정의

    통합된 데이터 : 자료의 중복을 배제한 데이터

     저장된 데이터

    운영 데이터 : 조직의 업무

    공용 데이터 : 공동사용 데이터

 

데이터베이스 특성

    실시간 접근성 : 쿼리에 대해서 실시간 응답

    계속적인 변화 : 삽입, 삭제 갱신 최신의 데이터

    동시공용 : 다수가 같은 데이터 이용

    내용참조 : 데이터 내용으로 데이터를 찾음

 

데이터베이스 종류 

     파일 시스템 ; 데이터베이스 전단계 데이터 저장 방싟

      관계형 데이터 베이스  시스템

     계층형 데이터베이스 시스템 : 데이터를 상하 종속적인 관계로 계층화

     네트워크 데이터베이스 관리 시스템 : 데이터를 네트워크상의 망상형태로 표현(IDS ,IDMS)

 

DBMS :데이터관리 소프트웨어

DBMS유형

     키-값 DBMS : 유니크 키 하나의 값

     컬럼 기반 데이터 저장 DBMS : KEY안에 조합으로 된 여러개의 필드

     문서 저장 DBMS : 값의 데이터 타입이 문서라는 타입을 이용하는 DBMS

     그래프 DBMS : 시맨틱 웹과 온톨로지 그래프표현

 

DBMS특징 : 무결, 일관, 회복, 보안 , 효율성

빅데이터

빅데이터 특성: 데이터의 양, 데이터의 다양성, 데이터의 속도

    빅데이터 수집 저장 처리 기술

          비정형/반정형 데이터 수집 : 정제되지않은 데이터 수집 전송 기술

           정형 데이터 수집 : 정제된 데이터 수집 전송 기술

           분산데이터 저장/처리 : 대용량 파일의 분산 저장 분산 처리

           분산데이터베이스 : HDFS(하둡분산파일시스템)칼럼기반 실시간 조회 업데이트

 

NoSQL: 조인연산x 수평적 확장 DBMS

NoSQL특성 :  

             Basically available : 언제든지 데이터 접근가능

             soft-state - 외부에서 전송된 정보를 통해 결정

             eventually consistency : 일관성 유지

Nosql 유형

              Key-Value store : 유니크한 키에 하나의 값

               Column Family data store : key안에 조합으로된 여러개의 필드

              document store : 키의 데이터타입이 문서타입

              graph dbms 그래프 dbms(시맨틱웹 ,온톨로지(컴퓨터가 이해할수있도록 서술해놓은 지식베이스)

 

데이터마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으 로 통계적 규칙이나 패턴을 찾아내는 기술이다. ( 기출)

데이터마이닝 절차 : 목적설정 -> 데이터준비 -> 가공 -> 마이닝기법적용 -> 정보 검증

데이터마이닝 주요 기법

    분류규칙 : 과거 데이터로 새로운 값 예측

    연과규칙: 데이터안에 항목들간 종속관계

    연속 규칙: 연관 규칙에 시간관련 정보가 포함

    데이터 군집화 : 대상 레코드들을 유사한 특성을 지닌 소그룹으로 분할

 

 

 

 

데이터 모델구성요소 ( 21-1 기출)

- 개체 데이터 모델에서는 (  1. 연산 ) 을/를 이용하여 실제 데이터를 처리하는 작업에 대한 명세를 나타내는데 논리 데이터 모델에서는 (  2. 구조 ) 을/를 어떻게 나타낼 것인지 표현한다.

- (  3. 제약조건 ) 은/는 데이터 무결성 유지를 위한 db의 보편적 방법으로 릴레이션의 특정 칼럼에 설정하는 제약을 의미하며, 개체무결성과 참조 무결성 등이 있다. 

 

 

        

+ Recent posts