데이터 입출력 구현
데이터 모델 : 현실세계의 정보를 인간과 컴퓨터가 이해할수 있도록 추상화하여 표현한 모델
데이터 모델 절차 : 요구사항 분석 -> 개념적설계(E-R) -> 논리적설계 -> 물리적 설계 ( 기출 21-1)
논리 데이터 모델링: 사람이 이해하기 쉽게 표현
논리 데이터 모델링 종류
관계 데이터 모델: 테이블형태, 1:1, 1:N, N:M
계층 데이터 모델 : 트리형태(상하) , 1:N
네트워크 데이터 모델 : 그래프형태 , N:M
튜플 : 행 , 튜플의 수는 카디널리티,기수
속성 : 열 , 속성의 수는 디그리 혹은 차수 , 하나의 속성이 취할 수 있는 같은 타입의 원자값들의 집합은 도메인
정규화와 이상현상
이상현상 : 데이터 중복성으로 인해 릴레이션을 조작할때 발생하는 비합리적 현상 ( 기출)
삽입이상 : 불필요한 세부정보 입력 , 삽입될 값이 없을 때
삭제이상 : 다른정보도 삭제
갱신이상 : 중복을 포함하면서 수정되어 다른 항목까지 수정되어야할 때
이상이 발생하면 여러개의 릴레이션으로 분해 -> 정규화(정보의 중복을 배제하여 이상의 발생 방지)
정규화 : 데이터 모델에서 중복성제거 데이터 일관성 정확성 유지 무손실 분해과정
정규화 단계
1정규형 : 원자값이 아닌 도메인 분해
2 : 부분한수 종속제거(완전 함수적 종속만족)
3 : 이행함수 종속제거
보이스 코드 정규형 : 결정자가 후보 키가 아닌 함수 종속 제거
4정규형 : 다치 종속성 제거
5 정규형 : 조인종속
반(비)정규화 : 성능향상과 단순화를 위해 중복 통합 분리를 수행하는 데이터 모델링 기법 (기출) (기출 21-1)
수직 분할 , 수평 분할
뷰 : 가상의 테이블
시스템 카탈로그 : 스키마 및 객체에 관한 정보를 포함하고 있는 시스템 데이터베이스(갱신 불가)
ODBC : 데이터베이스 접근 api
JDBC : 자바 api
절차형 sql :PL/SQL
스토어드 프로시저 : 데이터베이스 시스템 처리속도 고도화기법
트리거 : 삽입,수정,제거 발생시 DBMS 실행 프로시저
SQL
DDL 데이터 정의어
CREATE TABLE 테이블 명 , ALTER TABLE , DROP TABLE
DML 데이터 조작어
SELECT FROM , INSERT INTO VALUES , DELETE FROM , UPDATE SET
DCL 데이터 제어어
GRANT , REVOKE , ROLL
TCL 트랙잭션 제어어
COMMIT(결과를 물리적 디스크에 저장하고 성공적이라고 알림)
ROLLBACK
SAVEPOINT
SQL PLUE : SQL실행시 볼수 있는 툴
튜닝 : 최적화
로우 마이그레이션 : 데이터를 다른 블록에 성능저하
로그 체이닝 : 두개의 블랙에 성능 저하
인덱스 : 데이터에 빠르게 접근하기 위해 키값,포인터 쌍으로 되는 데이터구조
클러스터드 인덱스: 인덱스 키의 순서에 따라 데이터 정렬
넌 클러스터드 인덱스 : 인덱스의 키값만 정렬되고 데이터는 실제 정렬 x
트랜잭션의 특징
원자성 : 수행이 완료되지 않으면 전혀 수행되지 않아야한다.
일관성 : 시스템 고정요소는 수행 전후가 같아야한다.
격리성 : 다른 트랜잭션의 간섭을 받지 않아야 한다.
영속성 : 결과가 데이터베이스가 영구히 기억되어야한다.
기아현상 : 하나는 실행되지않는것.
로킹 : LOCK을 획득 시 에만 사용 가능 하게 , 2단계 로킹
파티션 : 대용량의 테이블, 인덱스를 작은 논리적 단위인 파티션으로 나누는것
수평파티셔닝 : 각행을 분산
수직파티셔닝 : 컬럼을 분할
범위분할 : 지정한 열의 값을 기준으로 분할
해시분할 : 해시 함수결과값에 따라
리스트분할 : 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능
조합분할 : 범위,해시,리스트분할중 2개이상의 파티셔닝을 결합하는 방식 파티션이 클때 사용
관계 대수 : 관계형 데이터베이스 절차적 정형 언어
관계 대수 연산자
일반 집합 연산자
합집합, 교집합 ,차집합 , 카디션 프로덕트(X)
순수 관계 연산자
셀렉트, 프로젝트(ㅠ) , 조인 , 디비전
관계 해석 : 튜플 관계해석과 도메인 해석 비절차적 언어
논리데이터 모델링 속성 : 개체, 속성, 관계
개체-관계 모델 : 데이터과 관계를 사람이 이해할수 있게 표현한 모델
참조무결성 제약조건 : 릴레이션간 참조의 일관성
제한 : 다른테이블이 삭제할 테이블을 참조중이면 제거 x
연쇄 : 참조하는 테이블까지 제거
널값 : 참조되는 릴레이션에서 튜플 제거 , 참조하는 튜플들의 외래값에 null
파티션 장점 : 성능 향상 ,가용성 향상, 백업 가능, 경합 감소
데이터베이스 정의
통합된 데이터 : 자료의 중복을 배제한 데이터
저장된 데이터
운영 데이터 : 조직의 업무
공용 데이터 : 공동사용 데이터
데이터베이스 특성
실시간 접근성 : 쿼리에 대해서 실시간 응답
계속적인 변화 : 삽입, 삭제 갱신 최신의 데이터
동시공용 : 다수가 같은 데이터 이용
내용참조 : 데이터 내용으로 데이터를 찾음
데이터베이스 종류
파일 시스템 ; 데이터베이스 전단계 데이터 저장 방싟
관계형 데이터 베이스 시스템
계층형 데이터베이스 시스템 : 데이터를 상하 종속적인 관계로 계층화
네트워크 데이터베이스 관리 시스템 : 데이터를 네트워크상의 망상형태로 표현(IDS ,IDMS)
DBMS :데이터관리 소프트웨어
DBMS유형
키-값 DBMS : 유니크 키 하나의 값
컬럼 기반 데이터 저장 DBMS : KEY안에 조합으로 된 여러개의 필드
문서 저장 DBMS : 값의 데이터 타입이 문서라는 타입을 이용하는 DBMS
그래프 DBMS : 시맨틱 웹과 온톨로지 그래프표현
DBMS특징 : 무결, 일관, 회복, 보안 , 효율성
빅데이터
빅데이터 특성: 데이터의 양, 데이터의 다양성, 데이터의 속도
빅데이터 수집 저장 처리 기술
비정형/반정형 데이터 수집 : 정제되지않은 데이터 수집 전송 기술
정형 데이터 수집 : 정제된 데이터 수집 전송 기술
분산데이터 저장/처리 : 대용량 파일의 분산 저장 분산 처리
분산데이터베이스 : HDFS(하둡분산파일시스템)칼럼기반 실시간 조회 업데이트
NoSQL: 조인연산x 수평적 확장 DBMS
NoSQL특성 :
Basically available : 언제든지 데이터 접근가능
soft-state - 외부에서 전송된 정보를 통해 결정
eventually consistency : 일관성 유지
Nosql 유형
Key-Value store : 유니크한 키에 하나의 값
Column Family data store : key안에 조합으로된 여러개의 필드
document store : 키의 데이터타입이 문서타입
graph dbms 그래프 dbms(시맨틱웹 ,온톨로지(컴퓨터가 이해할수있도록 서술해놓은 지식베이스)
데이터마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으 로 통계적 규칙이나 패턴을 찾아내는 기술이다. ( 기출)
데이터마이닝 절차 : 목적설정 -> 데이터준비 -> 가공 -> 마이닝기법적용 -> 정보 검증
데이터마이닝 주요 기법
분류규칙 : 과거 데이터로 새로운 값 예측
연과규칙: 데이터안에 항목들간 종속관계
연속 규칙: 연관 규칙에 시간관련 정보가 포함
데이터 군집화 : 대상 레코드들을 유사한 특성을 지닌 소그룹으로 분할
데이터 모델구성요소 ( 21-1 기출)
- 개체 데이터 모델에서는 ( 1. 연산 ) 을/를 이용하여 실제 데이터를 처리하는 작업에 대한 명세를 나타내는데 논리 데이터 모델에서는 ( 2. 구조 ) 을/를 어떻게 나타낼 것인지 표현한다.
- ( 3. 제약조건 ) 은/는 데이터 무결성 유지를 위한 db의 보편적 방법으로 릴레이션의 특정 칼럼에 설정하는 제약을 의미하며, 개체무결성과 참조 무결성 등이 있다.
'IT 관련 > 정보처리기사' 카테고리의 다른 글
2022 2회정보처리기사 실기 chatper 8 SQL(빈도자주) (0) | 2022.04.28 |
---|---|
2022 2회 정보처리기사 실기 chapter5 인터페이스 구현 (0) | 2022.04.28 |
2022 2회 정보처리기사 실기 chapter 3 통합구현 (0) | 2022.04.28 |
2022 2회 정보처리기사 실기 chapter6 화면설계 (0) | 2022.04.27 |
2022 3회 실기 정보처리기사 chapter1 요구사항분석 (빈도 자주) (0) | 2022.04.27 |