자료구조와 함께 배우는 알고리즘 입문 C언어편- 6장

6장_정렬(sorting)

정진우

Published in

Quantum Ant

9 min readAug 10, 2019

6장에서는 데이터 집합을 일정한 줄지어 늘어서도록 바꾸는 정렬에 대해 다루고 있다.

정렬 알고리즘은 내부정렬(internal sprtomg)과 외부 정렬(external sorting)로 나눌 수 있다.

내부 정렬 : 정렬할 모든 데이터를 하나의 배열에 저장할 수 있는 경우에 사용하는 알고리즘

외부 정렬 : 데이터가 너무 많아 하나의 배열에 저장할 수 없는 경우에 사용하는 알고리즘

이 책에서 다룬 정렬 알고리즘은 8개(버블, 단순 선택, 단순 삽입, 셀, 퀵, 병합, 힙, 도수)이며 모두 내부 정렬이다.

*버블 정렬

버블 정렬은 이웃한 두 요소의 대소 관계를 비교하여 교환을 반복하는 정렬이다.

#define swap (type, x, y) do { type t= x; x = y; y = t; } while(0)
/* 비교한 두 요소를 교환하는 함수 */

<그림 2> 처럼 코딩을 할 경우 불필요한 스캔을 하게 되어 효율이 떨어진다. 효율을 높이기 위해 각각의 패스에서 비교, 교환을 하다가 어떤 시점에서 이후에 교환이 수행되지 않는다면 그것 보다 앞쪽의 요소는 이미 정렬을 마친 상태라고 해도 된다. 따라서 <그림 4>에서 첫 요소를 제외한 5개의 요소가 아닌 3개의 요소에서만 비교, 교환을 하면된다. <그림 6>은 개선한 함수이다.
시간 복잡도는 O(n²)이다.

*단순 선택 정렬

단순 선택 정렬은 가장 작은 요소부터 선택해 알맞은 위치로 옮겨 순서를 맞추는 정렬이다.

아직 정렬하지 않은 부분에서 가장 작은 키의 값(a[min])을 선택
a[min]과 아직 정렬하지 않은 부분의 첫 번째 요소를 교환

시간 복잡도는 O(n²)이다.

*단순 삽입 정렬

다순 삽입 정렬은 선택한 요소를 그보다 더 앞쪽의 알맞은 위치에 ‘삽입’하는 정렬이다. 단순 선택 정렬과 비슷해 보이지만 단순 선택 정렬은 값이 가장 작은 요소를 선택해 위치를 옮긴다는 점에서 다르다.

a[i]을 원하는 값에 삽입 하려면 a[i]보다 작은 요소를 만날 때까지 이웃한 왼쪽의 요소(a[i - 1])를 a[i]에 대입하는 작업을 반복한다.(원래의 a[i] 요소 값은 tmp에 저장) 작은 값을 만나 멈추면 그위에 원래의 a[i]를 대입한다.

정렬된 열의 왼쪽 끝에 도달
tmp보다 작거나 같은 key를 갖는 항목 a[j -1]발견 (j = i )

위의 두 조건 중 하나를 만족할 때까지 j를 1씩 감소시키면서 반복한다. 위의 법칙에 드모르간 법칙을 이용하면 아래의 두 조건을 모두 성립해야 한다.

j가 0보다 큼
a[j -1]값이 tmp보다 큼

시간 복잡도는 O(n²)이다.

*셸 정렬

셸 정렬은 단순 삽입 정렬의 장점은 살리고 단점은 보완한 정렬로 정렬할 배열의 요소를 그룹으로 나눠 각 그룹 별로 단순 삽입 정렬을 수행하고 합치는 정렬이다.

<그림 11>은 4칸만큼 떨어진 요소를 모아 그룹을 4개로 나우어 정렬한 ‘4-정렬’이다. 아직 정렬을 마친 상태는 아니지만 정렬을 마친 상태에 가까워졌다.

정렬되지 않은 상태의 배열에서 ‘4-정렬’, ‘2-정렬’로 정렬이 된 상태에 가까운 배열로 만든 다음 단순 삽입 정렬을 수행하여 정렬을 마친다.
증분값(h값)을 선택할 때는 주의해야 할 게 있다. 증분값을 잘못 설정해야 할 경우 그룹을 나누더라도 정렬 알고리즘이 작동하지 않는다.

1부터 시작하여 3배한 값에 1를 더한 값(1, 4, 13, 40…)
h 초깃값이 요소 개수 n을 9로 나눈 값을 넘지 않아야 한다.

*퀵 정렬

퀵 정렬은 배열 중에서 그룹을 나누는 기준(피벗)을 정하고 다른 요소를 기준에 따라 그룹을 나누는 작업을 반복하여 정렬하는 것이다.

<그림 14>는 퀵 정렬 중 처음 그룹을 나누는 과정이다. 피벗 이하의 요소들과 피버 이상의 요소들을 각각 이 작업을 반복하면 정렬을 할 수 있다.

<그림 15>는 재귀 알고리즘을 써서 퀵 정렬을 구현했다. 퀵 정렬을 비재귀적으로 구현하기 위해서는 스택을 이용하면 된다.

lstack와 rstack스택에 푸시한 처음 푸시한 값은 각각 ‘첫 요소’와 ‘끝 요소’의 인덱스이다. 배열을나누는 작업이 끝나면 왼쪽 그룹 인덱스를 lstack에 오른쪽 그룹 인덱스를 rstack에 푸시한다. 스택이 비면 정렬이 끝난다.
인덱스를 푸시할 때 어떤 것을 먼저 푸시하는지에 따라 스택의 용량이 달라진다.