• 데이터 저장과 파일

    8.1 물리적 저장장치

    • 물리적 저장장치
      • 물리적 저장장치들은 데이터 접근 속도를 기준으로 다양한 장치로 분류

           

         

    • 기억 지속성 관점에서 분류
      • 휘발성
        • 주기억장치: 레지스터, 캐시, 메인 메모리로 주로 CPU가 이용
      • 비휘발성
        • 보조기억장치: 디스크와 같이 주기억장치보다 하위에 위치하여 주기억장치를 보조
        • 3차 기억장치: 광학 디스크 드라이브, 자기 테이프
      • 캐시
        • 고비용 저장장치로 빠른 데이터 접근 속도를 보장
        • 레지스터를 제외하면 프로세서가 가장 빠르게 접근
      • 메인 메모리
        • 프로그램과 데이터가 적재되는 공간
      • 플래쉬 메모리
        • 메인 메모리와 유사하나 비휘발성 저장장치로 전원이 꺼져도 데이터를 유지
        • 디스크보다 빠른 접근 가능
      • 자기 디스크
        • 주로 데이터베이스 전체가 저장되는 공간으로 데이터를 안정적으로 저장
      • 광학 디스크 드라이브
        • 대표적인 광학 기억장치는 CD
        • DVD의 경우 4.7GB 정도
      • 테이프 저장장치
        • 기록 데이터를 저장하는데 사용
        • 자기 디스크보다 용량이 크고 저렴
        • 데이터를 순차적으로 읽어야 하기 때문에 데이터 접근이 매우 느림

           

    8.2 RAID

    복수의 디스크를 사용

  • 표준 RAID 수준
    • RAID 0 수준: 스트라이핑
      • 스트라이핑: 빠른 데이터 입출력을 위해 데이터를 여러 디스크에 나누어 저장
      • 데이터를 중복 저장하지는 않기 때문에, 디스크 장애 발생시 데이터 손실 발생
    • RAID 1 수준: 미러링
      • 데이터를 중복 저장하기 때문에, 디스크 장애 발생시 데잍어 복구가 가능
      • 용량이 큰 데이터에 대한 병렬적으로 빠른 읽기가 가능
      • 쓰기의 경우 성능이 저하
    • RAID 0+1 수준: 스트라이핑과 미러링
    • RAID 2 수준: 스트라이핑과 에러 검출 및 정정
    • RAID 3 수준: 패리티비트 기반 스트라이핑
    • RAID 4 수준: 패리티비트 기반 개량 스트라이핑
    • RAID 5 수준: 삽입 패리티 기반 개량 스트라이핑

       

  • 신뢰성 향상
    • 데이터를 중복시켜 여러 디스크에 저장하면, 저장한 데이터가 디스크의 장애에 의해서 손실되어도 복구가능
    • 미러링된 디스크들은 각 디스크의 평균 고장시간과 평균 수리시간에 영향
      • 평균 고장시간: 디스크가 고장 나기까지 걸리는 시간
      • 평균 수리 시간: 고장 난 디스크를 교체하고 데이터를 복구하는데 걸리는 시간
      • 평균 데이터 손실 시간: 미러링된 디스크가 데이터를 손실하는데 까지 걸리는 시간

       

  • 성능 향상
    • 미러링: 복수의 디스크에 병렬적인 접근하여 처리함으로써 읽기 속도 향상
    • 스트라이핑: 데이터를 다수의 디스크에 나누어 저장하기 때문에 성능이 향상

         

         

         

    8.3 파일 구성

    • 파일 구성
      • 파일: 데이터를 영구적으로 저장하기 위해 사용되는 가장 기초적인 구조
      • 블록: 파일을 고정적인 길이로 분할하여 생기는 균등한 크기의 데이터 묶음

        =>블록 단위로 분할되어 디스크에 기록

      • 레코드: 블록을 구성하는 요소로, 더 이상 분리 되어 저장되지 않는 최소 데이터 저장단위
    • 고정 길이 레코드
      • 각 레코드에 고정적인 바이트 수를 할당하는 기법

    • 고정 길이 레코드의 문제점
      • 블록의 길이가 레코드 길이로 정확히 나뉘어 떨어지지 않는 경우

        => 블록 내의 남은 공간으로 저장 공간이 낭비됨

      • 레코드 삭제 시
        • 특정 레코드가 삭제되면, 해당 레코드가 저장된 공간이 비기 때문에 낭비가 발생
      • 대처 방법
        • 마지막 레코드로 공백 대체
        • 삭제 레코드 이후에 레코드를 이동
        • 가용 리스트 관리
    • 가변 길이 레코드
      • 블록에 저장되는 레코드의 길이가 서로 다르게 레코드에 가변적인 길이를 할당하는 방법
      • 가변길이 레코드가 쓰이는 경우
        • 한 블록 내에 저장되는 레코드의 유형이 둘 이상
        • 길이가 고정되지 않은 컬럼의 개수가 하나 이상
        • 레코드가 멀티셋을 허용한 컬럼을 가질 때

          *멀티셋: 컬럼값이 여러 개인 컬럼

             

    • 파일 구조화 방법
      • 힙 파일 구조
        • 모든 레코드는 파일 내 임의의 위치에 위치
        • 저장 순서를 고려하지 않음
      • 순차 파일 구조
        • 레코드들이 특정 컬럼에 대한 값을 기준으로 정렬되어 저장
        • 정렬키로 검색키를 사용
      • 해시 파일 구조
        • 레코드를 입력 받아 레코드가 저장될 블록주소를 반환하는 해시 함수를 사용
    • 순차 파일 구조
      • 레코드가 검색키 순서대로 정렬
      • 레코드가 파일에 삽입되는 시점에서 키 값이 부여
      • 장점
        • 검색 키에 대한 정렬 연산이 불필요, 키 값들의 순서로 레코드를 판독하는 연산에 효율적
        • 현재 레코드에서 정렬된 키 순서로 다음 레코드를 찾을 때 부가적인 블록 접근이 불필요
        • 이진 탐색을 사용하면 더 빠르게 레코드를 검색
      • 단점
        • 레코드 삽입, 삭제에 많은 비용 소요됨
    • 다중 테이블 클러스터링 파일 구조
      • 빈번히 조인되는 테이블을 하나의 파일에 저장하기 위한 구조
      • 필요한 테이블이 미리 조인되어 저장

           

           

    8.4 저장장치 접근

    • 저장장치 접근
      • 파일은 논리적 관점에서의 저장이며, 실제 저장될 때에는 여러 개의 물리적 단위인 블록으로 저장

        일반적으로 2KB, 4KB, 8KB, 16KB, 32KB 사용

        • 블록은 데이터의 전송 단위로 블록 전송을 최소화할수록 입출력 소요 시간이 단축
        • 블록전송 최소화
          • 사용 중인 블록을 지속적으로 메모리에 적재
          • 한정적 공간으로 인하여 필요에 따라 특정 블록할당을 해지
          • 메모리 내부에 버퍼라는 공간에 블록을 저장하고, 이를 관리하기 위한 버퍼 관리자를 사용

               

    • 버퍼 관리자
      • DBMS상의 프로그램들은 필요한 블록이 있을 때 버퍼 관리자들에게 해당 블록을 요청
        • 요청된 블록이 버퍼에 있다면, 버퍼 관리자는 블록이 위치한 메모리 주소를 프로그램에게 전달
        • 요청된 블록이 없는 경우, 버퍼 관리자는 버퍼내의 새로운 공간을 할당하고 해당 블록을 적재
        • 더 이상 적재할 공간이 없다면, 버퍼에 있는 기존 블록을 선택하여 할당을 해지하고 해당 블록을 적재
    • 버퍼 관리자의 기능
      • 버퍼 교체 전략
        • 가용 공간을 확보하기 위해 기존에 적재된 블록의 할당을 특정 기준에 의하여 해지
        • 미래에 가장 적게 사용될 블록을 선택하여 디스크로 내보내는 것이 이상적인 버퍼 교체 전략
          • LRU(Least Recently Used)

            최근에 참조된 블록은 다시 참조될 가능성이 높다고 판단하여 가장 최근에 적게 참조된 블록을 교체

          • MRU(Most Recently Used)

            최근에 가장 많이 사용된 블록을 선택하여 블록을 교체

      • 고정 블록
        • 장애로 인하여 메모리의 데이터가 손실되어 작업이 중단될 경우, 중단된 작업의 결과물이 디스크에 기록되는 것을 방지
        • 디스크 블록이 교체되는 것을 제한
      • 블록 강제 출력
        • 시스템 로그와 같이 중요한 데이터는 디스크에 영구적으로 기록되어야 함
        • 버퍼 공간이 필요 없어도 강제로 디스크에 기록

'데이터베이스' 카테고리의 다른 글

10 인덱싱과 해싱 II  (0) 2016.03.14
09 인덱싱과 해싱 I  (0) 2016.03.11
07 정규화 II  (0) 2016.03.10
06 정규화 I  (0) 2016.03.10
05 SQL  (0) 2016.03.09
Posted by redcode.
,