[OSTEP] 영속성 - Redundant Array of Inexpensive Disk(RAID)

OSTEP - 16

June 16, 2022

honggoo

honggoo

본격적인 개발 블로그를 시작해 볼까!

1. Redundant Array of Inexpensive Disk(RAID)

직역하면 경제적인 Disk의 이중화 배열이다.
디스크를 사용할 때 디스크가 좀 더 빨랐으면 하는 바램이 있다. I/O 작업은 느려서 전체 시스템의 병목이 되기 때문이다.

RAID 기술은 여러 개의 디스크를 조화롭게 사용하여 고속이면서 대용량의 신뢰할 수 있는 디스크 시스템을 만든다.
RAID는 여러 개의 디스크와 메모리, 시스템을 관리하기 위한 하나 또는 그 이상의 프로세서로 이루어진 복잡한 기계이다.
RAID의 하드웨어는 컴퓨터 시스템과 매우 유사하며 디스크의 그룹을 관리하기 위한 전용 시스템이다.
RAID의 장점
- 성능이다. 디스크 여러 개를 병렬적으로 사용하면 I/O 시간이 크게 개선된다.
- 용량이다.
- 신뢰성을 높일 수 있다. 데이터 중복 기술(redundancy)을 사용함으로써 RAID는 디스크 한 개의 고장은 감내할 수 있다.
- RAID는 이러한 장점을 투명하게 제공하여 확산력(deploy ability)을 크게 개선하였으며 사용자와 관리자가 소프트웨어 호환성을 전혀 걱정하지 않고 사용할 수 있게 되었다.

1.1 인터페이스와 RAID의 내부

상위에 존재하는 파일 시스템에게 RAID는 크고 빠르고, 신뢰할 수 있는 디스크로 보인다.
RAID도 선형적인 블럭들의 배열로 보이며 파일 시스템이 각 블럭을 읽거나 쓸 수 있다.
파일 시스템이 RAID에 논리적 I/O를 요청하면 RAID는 내부에서 어떤 디스크를 저급해야 요청을 완료할 수 있는지 계산한 후에 하나 또는 그 이상의 물리적 I/O를 발생시킨다.

RAID 시스템은 보통 별도의 하드웨어 박스 형태로 되어 있으며 호스트와 SCSI나 SATA와 같은 표준 인터페이스로 연결된다.
내부적으로 RAID는 꽤 복잡한데, RAID의 작업을 지시하는 펌웨어를 실행하는 마이크로 컨트롤러 그리고 블럭을 읽고 쓸 때 버퍼로 사용할 DRAM과 같은 휘발성 메모리가 있으며, 어떤 경우에는 쓰기를 안전하게 버퍼링하기 위한 비휘발성 메모리뿐 아니라 패리티 계산을 위한 전용 논리 회로를 갖고 있기도 하다.
상위 레벨의 관점에서 RAID는 특수한 컴퓨터 시스템이다.

1.2 RAID의 평가 방법

RAID를 구성하는 방법이 몇가지 있다.
세 개의 축을 중심으로 각 RAID 설계를 평가할 것이다.
1. 용량
2. 신뢰성
3. 성능
RAID 레벨 0(스트라이핑), 레벨 1(미러링), 레벨 4/5(패리티에 기반을 둔 중복 저장)을 다뤄보겠다.

1.3 RAID 레벨 0: 스트라이핑

RAID 레벨은 사실 중복 저장을 하지 않기 때문에 RAID 레벨이 아니다.
RAID 레벨 0 또는 스트라이핑(striping)이라고 더 잘 알려진 이 방식은 성능과 용량에 대해 훌륭한 상한 기준을 나타낸다.
스트라이핑은 위의 그림과 같이 블럭들을 여러 디스크에 걸쳐서 줄을 긋는 것처럼 저장한다.

위의 그림은 단순한 스트라이핑

위의 그림은 더 큰 청크 크기 단위로 스트라이핑(청크 크기: 2 블럭)

청크 크기

작은 청크 크기가 의미하는 것은 많은 파일들이 여러 디스크에 걸쳐서 스트라이프된다는 말이며 그 결과로 하나의 파일을 읽고 쓰는 데 병렬성이 증가하게 된다.
- 하지만, 블럭의 위치를 여러 디스크에서 찾아야 하므로 위치 찾기 시간이 늘어난다.
큰 청크 크기의 경우에는 파일 내의 병렬성은 줄어들고 따라서 높은 처리 성능을 얻으려면 여러 요청을 병행하게 실행해야 한다.
- 하지만 큰 청크 크기의 경우 위치 찾기 시간을 줄어든다.

RAID-0 평가하기

성능은 준수하다.
용량은 매우 좋다.
신뢰성은 떨어진다.
- 복구할 수 있는 디스크가 없기 때문에

1.4 RAID 레벨 1: 미러링

RAID 레벨 1 또는 미러링으로 알려져 있다.
미러링을 사용하는 시스템에서는 각 블럭에 대해서 하나 이상의 사본을 둔다.
각 사본은 당연히 서로 다른 디스크에 저장된다.

위의 그림은 단순한 미러링이다.
미러링된 배열에서 블럭을 읽을 때 RAID는 원본을 읽을 건지 사본을 읽은건지 선택할 수 있따.
반면에 블럭을 쓰는 경우에는 그렇게 선택할 수 없다.
- RAID는 신뢰성을 유지하기 위해서 두 벌의 데이터를 모두 갱신해야 한다.
- 이러한 쓰기 요청은 병렬적으로 처리될 수 있댜ㅏ.

RAID-1 분석

용량 측면에서는 RAID-1은 비용이 많이든다. 미러링 레벨이 2라면 최대 사용 가능한 용량의 반만 사용할 수 있다.
신뢰성 측면에서는 괜찮은 편이다. 디스크 중 어느 것에서 고장이 발생하여도 감내할 수 있다.
속도는 평균적으로 하나의 디스크에 쓰는 시간보다는 조금 더 길다.
랜덤 읽기가 미러링된 RAID에서는 최고의 워크로드이다.

1.5 RAID 레벨 4: 패리티를 이용한 공간 절약

패리티 기반의 접근 방법은 저장 공간을 더 적게 사용하려고 하여 미러링 기반시스템이 지불하는 엄청난 공간 낭비를 극복하려고 시도한다.
- 그 대신 성능이라는 비용을 지불해야 한다.

위의 그림은 패리티가 있는 RAID-4 이다.
- 각 데이터 스트라이프마다 해당 스트라이프에 대한 중복 정보를 담고 있는 패리티 블럭 하나를 추가한다.

위의 그림은 패리티 계산법이다.
- 어떤 줄이던 그 줄의 1의 수는 패리티 비트를 포함해서 짝수가 되어야 한다.
- 이것은 RAID의 패리티가 정확하게 동작하기 위해서 반드시 유지해야 하는 불변량이다.

RAID-4 분석

용량 측면에서는 패리티 정보의 저장을 위해 각 디스크 그룹에 속한 디스크 하나를 사용하기 때문에 (N-1)*B의 저장 공간을 제공한다.
신뢰성 측면에서 RAID-4는 오직 하나만의 디스크 고장을 감내할 수 있다.
성능은 패리티 디스크를 제외한 모든 디스크를 활용할 수 있다.

위의 그림 처럼 패리티 디스크에서 쓰기는 패리티 디스크로 인해서 병목 현상이 발생한다.
- 이 경우를 패리티 기반 RAID의 samll-write 문제라고 부른다.
- 데이터 디스크들에 대한 입출력은 서로 병렬적으로 실행하는 것이 가능하나 쓰기는 순차적으로 처리된다.

1.6 RAID 레벨 5: 순환 패리티

Small write 문제를 해결하기 위해서 RAID-5의 개념이 등장하였다.
RAID-5는 RAID-4와 거의 동일하게 동작하지만 패리티 블럭을 순환(rotate) 시킨다는 점이 다르다.

위의 그림은 순환하는 패리티를 사용하는 RAID-5이다.

RAID-5 분석

랜덤 쓰기 성능은 요청들을 병렬적으로 처리할 수 있기 때문에 RAID-4 대비 눈에 띄게 개선된다.

1.7 RAID 비교: 정리

결론적으로 성능만을 원하고 신뢰성을 고려하지 않는다면 스트라이핑이 최고이다.
만약 랜덤 I/O의 성능과 신뢰성을 원한다면, 미러링이 최선이다. 하지만 용량을 손해본다.
만약 용량과 신뢰성이 목적이라면, RAID-5가 승자이다. small write 성능에 대한 비용만 지불하면 된다.

1.8 요약

RAID는 여러 개의 독립적인 디스크를 대용량의, 더 신뢰성 있는 하나의 개체로 변형시킨다.
투명하게 위의 일을 하기 때문에 상위 계층의 하드웨어와 소프트웨어는 변형 사실에 대해 인지하지 못한다.

공유하기

Twitter Facebook LinkedIn

댓글남기기

참고

[OSTEP] 영속성 - 파일 시스템 구현

June 25, 2022

OSTEP - 18

[OSTEP] 영속성 - 파일과 디렉터리

June 24, 2022

OSTEP - 17

자식 프로세스와 부모 프로세스는 파일 디스크립터를 어떻게 공유할까?

June 24, 2022

터미널 출력 버퍼와 파일 출력 버퍼의 차이

[OSTEP] 영속성 - 하드 디스크 드라이브

June 15, 2022

OSTEP - 15